[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [bep] bep-eng.dicの変な読み
- To: bep@argv.org
- Subject: Re: [bep] bep-eng.dicの変な読み
- From: Koichi INOUE <inoue@argv.org>
- Date: 20 May 2001 22:39:15 +0900
- Delivered-To: mailing list bep@argv.org
- Mailing-List: contact bep-help@argv.org; run by ezmlm
- Organization: Accessibility Research Group for the Visually Impaired(ARGV)
- User-Agent: T-gnus/6.15.0 (based on Oort Gnus v0.01) (revision 09) SEMI/1.14.3 (Ushinoya) FLIM/1.14.2 (Yagi-Nishiguchi) APEL/10.3 Emacs/21.0.100 (i386-windy-freebsd4.2) MULE/5.0 (SAKAKI)
井上です。
Noritsugu Nakamura <nnakamur@...> writes:
> kanjifn.cpp で normalize されたあとの pszIn 文字列として
> ローマ字に読み下せるのなら読み下してしまうというルーチンで
> 良いのでしょうか?とりあえず
>
> Nakamura は読み下す
> bep は be はローマ字に直せるが、bep 全てを
> ローマ字に直すことができないので読み下さない。
そうです。
jpEngToKana()みたいな仕様か、もっとよい方法があればそちらで、関数になっ
ているとありがたいです。
GRの辞書を使うので仕様を一応合わせた方がいいのですが、意見の分かれるとこ
ろでは、
・ローマ字はいわゆるヘボン式(ti, hu, TYAなどでなくCHI, FU, CHA)
・KOHNOのようなHによる長音のサポート
などがあります。
それと、GRでは4文字に満たない単語はローマ字読み検査をしない仕様になって
いるのですが、このチェックはローマ字読みルーチンの外でやるのが汎用性があっ
ていいと思います。
処理の流れとしては、一度英語辞書で変換できるかをjpEngToKana()で見てから、
ダメだったもののうち4文字以上の単語をローマ字読みルーチンに渡して、結果
を読み上げに回すという感じで考えています。ローマ字読みも単語辞書で上書き
して直せることになります。
なんだか作りがめんどうになりそうで、未だにやってない項目の一つです。
できそうだったらすみませんがお願いします。
--
Koichi Inoue, ARGV
E-Mail: inoue@...
ICQ UIN: 74900690