[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: こんにちは藤沼です



井上です。
藤沼さんこんにちは。

"Teruyoshi Fujinuma" <istal.teruyoshi@nifty.com> writes:

>  ところで出てきた早々質問でもうしわけありませんが、UNIX環境が音声化
> された時に変換された漢字を確認するための詳細読みが使用されるとすればその
> ファイルの各フィールドに入れる読みのデータについてそろそろ考えたいと思っ
> ております。

実はBUGと姉妹品(?)のBilingual Emacspeak Project の方でEmacspeakを日
本語化したときに漢字入力等で使用する詳細読みデータについて考える必要が
あります。
いろいろなアプローチが考えられますが、まずはフリーな形で入手できて一般
的な詳細読みデータが必要です。
# まだ詳細読み機能そのものは実装されていませんが。

>  基本となるファイルの内容と項目をあらかじめ登録しておけば、後は必要に応
> じてPERL等で並べ替えたり削除したりすれば良いのですから簡単ですが、後から
> フィールドを付け加えるのはなんとも面倒です。
>  点字の文字列も登録するフィールドを設ける必要もあるかもしれません。
> この際ですから元となる将来的に作り直さなくても良いファイルを作成したいと
> 考えております。

ご協力いただけるなら嬉しく思います。
感じと音読み、詳細読みという構成以外考えていなかったのですが、たしかに
点字表記によるフィールドもあるといいかも知れませんね。
点字についてはカタカナ表記から自動生成する、あるいはカタカナ表記にマス
あけの情報だけ最初から付加するという方法もあると思います。
ただ手元にカタカナからNABCCに変換するスクリプトや関数がないので、誰で
も簡単に変換して使えるようにするには必要な情報はどんどん含めてしまうと
いう方法もあるでしょうね。たとえば文字種(ひらがな、カタカナ、記号、第
1・第2水準、2バイト半角、NEC特殊文字など)の属性も入れておくとよい
かも知れません。
他にどんなものがあるでしょうか?

-- 
                    Koichi Inoue, ARGV
                    E-Mail: inoue@...