[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [bep] bep-eng.dicの変な読み



井上です。

Noritsugu Nakamura <nnakamur@...> writes:

> kanjifn.cpp で normalize されたあとの pszIn 文字列として
> ローマ字に読み下せるのなら読み下してしまうというルーチンで
> 良いのでしょうか?とりあえず
> 
> Nakamura は読み下す
> bep は be はローマ字に直せるが、bep 全てを
> ローマ字に直すことができないので読み下さない。

そうです。
jpEngToKana()みたいな仕様か、もっとよい方法があればそちらで、関数になっ
ているとありがたいです。
GRの辞書を使うので仕様を一応合わせた方がいいのですが、意見の分かれるとこ
ろでは、
・ローマ字はいわゆるヘボン式(ti, hu, TYAなどでなくCHI, FU, CHA)
・KOHNOのようなHによる長音のサポート
などがあります。
それと、GRでは4文字に満たない単語はローマ字読み検査をしない仕様になって
いるのですが、このチェックはローマ字読みルーチンの外でやるのが汎用性があっ
ていいと思います。
処理の流れとしては、一度英語辞書で変換できるかをjpEngToKana()で見てから、
ダメだったもののうち4文字以上の単語をローマ字読みルーチンに渡して、結果
を読み上げに回すという感じで考えています。ローマ字読みも単語辞書で上書き
して直せることになります。

なんだか作りがめんどうになりそうで、未だにやってない項目の一つです。
できそうだったらすみませんがお願いします。

-- 
                    Koichi Inoue, ARGV
                    E-Mail: inoue@...
                    ICQ UIN: 74900690