[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

今日のミーティングを踏まえたTODO&予定 (案)



渡辺です。

今日のミーティングを踏まえた、BEPのTODOと予定の案です。
コメントや修正があったら教えてください。

--
渡辺隆行
Pls reply to takayuki@...
*2001年7月15日 BEP-TODO
優先度別に整理しなおした (大事なのはA。これをやっつけましょう。)

*A 今年度中に解決する課題 (担当者)
**SS共通 (W,K,I)
***A 2つのバイリンガルモードを作る (カタカナ英語、バイリンガル)
***A 必要な音声修飾機能の実装 (要 SAPIやDTalkerでどこまで実装できるかの検討)
    DECTalkでRamanが用意している声全部を日本語で用意できない。
    最低限どんな声が必要か?  何種類の声?、どんなキャラクタ(monotoneなど)?
****速度
****ピッチ
****Character mode; モード(Chr)をmonotoneにセットしたり、イントネーションを0にするなどでcharacterを作る
****VolumeをSSだけで変えたい
****要リストアップ作業

**WinSS (W)
***A 日本語エンジンが音声化しなくなるBug解決 (超重要) 
****ProTalkerはTTStestで落ちる!
****横田先生のVEを参考にできる可能性あり。
***A DTalkerをデフォルトにできるか?→OKならばDTalkerにする
****最大の問題はtext tag (in-text commands)が使えないかもしれないということ
****TextDataDoneではなくてAudioDoneでnext_queueを読み出せるようにする
****ピッチレンジなどのAudioFormatting実装; 他の機能で置き換えればできるかな?
****小出さんにメール;DTalker3.5のライセンス料金問い合わせ
****SAPI 5対応の日本語エンジン
***A TTSFind時;Lang=Japanese、Sex=Maleなどの情報もいれる
***A カタカナ英語読みの機能を入れる
***A スピーチエンジン固有の読み変え機能は使わない。
  例;MSのTTSでe.g.→for example等と読む問題
  DTalkerはこういう読み替えはしないはず
  読み替えるのはLisp側
***A Auditory Icon
****speak.exeにpコマンド実装(auditory-icon) ←これで非同期に鳴らす
****あらかじめwavに変換しておく

**Linux用SS (K,I)
***A thread関連改良(とりあえず落ちなくする)
****256(?)byte以上の文字列を渡した時に、正常に読めない問題を回避する
****cut&paste時に落ちる問題
****Latin-1の文字があるとssが必ず落ちる問題をなんとかする。
***A Audio cue、AU/WAV再生のサポート pコマンド
***A バイリンガル化 (dtalkerとOutloud); 動けばよい
**** 必要なコマンド実装

**ELisp (K,I,W)
***A 読み上げがおかしい現象のうち、Lisp部の問題をピックアップ&対処
****M-f移動時に行末の.を次行の先頭と一緒に読む問題
****C-e c でも読まない文字をなくす('を読み上げない場合がある等) 
****連続読み時改行を認知できる方法を見当 (行末にaudio cue)
***A unibyte-mode-pに対応
***A language-environmentがjapaneseだったらBEP機能がActiveになるようにする
***A ELispレベルで言語を判定し、読み上げエンジンをSSに指示する
***A いくつかのモジュールの日本語対応: emacspeak-speak, dtk-speak, dtk-tcl
***left parenなど記号の読みを音声出力の言語で切り替える。
   例: 英語時「left paren」, 日本語時「かっこ」
***Speech serverの言語を教えてもらう。それを確認して送る。
***A 新コマンド
****言語指定
****日米速度比指定
****カタカナ英語かnative英語かすべて日本語かの指定
****どの単位で日米切り替えをするかの指定
****ひらがな、カタカナ、全角半角、大文字小文字で声を修飾する機能追加
****要リストアップ
***A 詳細読み辞書
****データ修正 (機能と昨日だっけ?) → CVSで改良
***A voice名などを元に戻してオリジナル版との整合性を考える
***A MiniBufferにいる時はAuditory Iconで知らせる。
***A Echo Areaのメッセージは声を変える; list-interction-mode、abbrev
***A MewのNo New MessageなどはAuditory Iconを鳴らす

**ELisp (各種パッケージ)
各ユーザに任せる

**www.argv.org/bep/メインテナンス
***A m17nのアカウントをもらう (W,K)
***A ドキュメントやTODOのWebベースのメインテナンス (S)

**ドキュメント類 (叩き台を出した人が責任者、それにパッチを出す)
***A DOC module commit (I)
***A FAQ (S)

**開発形態
***A jitterbug等バグトラッキングシステムの導入 (K)    

**予定 (案)
***2001/7
Linuxスピーチサーバthread部分改良(とりあえず動くように) (K,I)
  7月中にpthread改良を出して、今のバージョンをfix
Emacspeakのコード読み (K,I,W,Y)
Win-SSの改良 (W)
FAQ開始 (S)
***2001/8
Emacspeakのコード読み (K,I,W,Y)
Ramanとのミーティング 8/11,12 (K,I,W,Y)
スピーチサーバに最低限必要な機能(コマンド)リストアップ (K,I,W,Y)
LinuxSSでこのコマンドを突っ込もうとした時にでる問題を解決 (K,I,W,Y)
Emacspeak側書き換え方針の決定 (K,I,W,Y)
Win-SSの改良 (W)
***2001/9
Emacspeak側の書き換え作業開始 (K,I,W,Y)
Win-SSの改良終了 (W)
***2001/10
Linuxスピーチサーババイリンガル化開始 (K,I)
***2001/11
***2001/12
スピーチサーバリリース、及びBEPベータ版テスト開始
詳細読み辞書整備
***2002/1,2
ユーザテスト
Lisp部の細かな改良
終了処理
ドキュメント整備
書類整備



*優先度が低い仕事
B 今年度中に解決したい課題
C いつか解決したい課題
D その他

**SS共通
***B 一文字読み機能の向上 (既存のエンジンは1文字読み上げが出来ない)
****録音した音(ひらがなの'あ'のauファイル)を再生するとレスポンスと明瞭さが向上するか?
****Phoneticで渡してPhoneticのまま読ます機能を使うと向上するか? (phonemic spelling)
***B 日本語と英語のspeech_rateの比を変えられるようにする
***B 音を止めた場所でカーソルも止まる機能; 行単位で止まる
***C 文節を飛ばし読みする機能
***Character Encoding Scheme; とりあえずSJISのまま行く

**WinSS
***C defaultの日本語エンジンを選択できるようにする
***C New東芝音声合成エンジンも試してみる
***D Pause&Resumeを実装←不要
***B Speak終了コマンドが必要か?
****BEPにPowerOff関数作る&Speakの処理ルーチン(メモリ解放)
***B コマンドをLinux版に合わす
***B 起動速度向上; とりあえず必要なインスタンスだけ作る

**Win日本語入力; この課題はやらなくて良い
***D IMEにegg IFをかぶせる;とりあえず困っていない
****仮名漢字変換時も入力キーを読み上げる
***D (VWSapiKy)
****キー読み上げ、IME読み上げ ON/OFF
****IMEオフの時はSpeakkey(OFF)にする
****フォーカスがないときは全機能をOFFにする
****キー読み上げ辞書、IME辞書の場所を環境変数から取得

**Linux用SS
***B esoundの利用の有無の決定; 使わない (asdに注目)
***B 読み上げ速度の高速化
****Linux版のDTalkerは単語間の間があく
***C ATK (GNOME Accessibility TK)のSPI (Service Provider Interface)への準拠を考慮する。

**ELisp (Emacspeak部)
***B 音を止めた場所でカーソルも止まる機能
***B ひらがな、カタカナ、全角半角、大文字小文字をvoice-fontで表現 (要 基礎調査)
***B 日本語と英語のspeech_rateの比を変えられるようにする
***C Windowsのtermモードでtelnet
***C phonemeシンボルでSSに渡す機能; は、
***B 速度の向上。とくにbepの起動時
***B 音声種別や音でminibufferにいるなどの画面上のウインドー位置を識別可能に。
    初心者通知用のモードを作る
***B ユーザ辞書機能をつける

**ELisp (各種パッケージ)
***C W3への対応 (暫く放置)
****W3のWin版でACSSが使えない理由を探す
(text-propertyはついているが声が変わりません。text-propertyはbetty-5555のような形のものがつきます。
stylesheetでvoice-familyを変えるとtext-propertyに反映するので、stylesheetそのものは読み込まれている。)
****Linux版: 一応ACSSに従って声は変わります。
(音声種別や表現が乏しいため、男性か女性かくらいの差しか分からない。)
**** w3-4.0-pre46.tar.gzな場合本来はちゃんと表示されている
ー時でも日本語が入っているページは<hr>とかその他よくわからないけれど音化けする
**** Octal xxxに変換する文字の正規表現がmultibyteの場合意図した動作にならず、
結果的にw3で読み上げ中に一部日本語でエラーになる。(未対処、Emacspeak全般)
**** テーブル中の移動がmultibyte状態では正しくできない。(この部分にはMule
  対応のコードが反映されていないと思われる。表示カラム数と文字数の違い?)
  (日本語のページでテーブル読みができないことの対策)
**** 売りであるACSS対応が日本語ではうまく動かなかった気がする。(確認します)
**** 今のw3がもうアップデートされないことへの前向きな対処を見当する必要あり。
新系統w3のフォロー?w3mに本気で対応?
***B w3m
****画面レイアウト情報をどう提示するか。(w3mはレイアウトが売り→音声で聞き難くなる。例:テーブル、フレーム)
****w3m-mme
***B mew
**** application/octaed/streamでかつその元のエンコードする前のものはtextな場合
C-c tabで*mew-message*に表示させるとかなりの確立で日本語が音化けする。
 (オクタルxxxなように)
***YaTeX
***eterm改良
***lookup
****読み上げを最適化して使えるものにする。
***Semi-Gnus
***wl

**www.argv.org/bep/メインテナンス
***ftpサイトが欲しい?
***m17n; 公開用

**ドキュメント類 (叩き台を出した人が責任者、それにパッチを出す)
***B インストールマニュアル
***B Emacsの説明 (全体の見た目構造など)
***B EmacspeakとBEPの説明 (概要紹介)
***B Web配信できる紹介ビデオやttyrec素材の準備
***B 英語での情報発信 (Webの整備)


**基礎研究: m17nな音声合成を中心としたAUI
***ひらがな、カタカナ、全角半角、大文字小文字をvoice-fontで表現する
****どう実装するのか; 同じ声の属性を変える、何の属性を使うのか?
***既存TTSには1文字読み上げ機能がない。これが問題であることを指摘
***声は何種類必要か? どんな声なら何種類聞き分けられるか?
  OSWは4種類(男、女、それぞれに声が高い、低い)
***どんな声をどんな性質にアサインすると分かりやすいか?
***異なる声と同じ声の音声修飾による使い分けの2種類の使い分け方
***ピッチは何種類くらい識別できるか?
***(まだまだあるはず!!!

**将来構想
***点字対応
***本家Emacspeakへの取りこみ
***m17n Emacspeak

**IPA的
***7/15ミーティング 1100-1500?
****議題
0) 議事録取り、毎月ミーティング、今日の段取り
1) IPA未踏ソフトウェア創造事業に関する説明、BEPのProposalの説明
2) BEP的なIPAへの取り組み方針; 詳細は3人(渡辺、切明、I)に任せてね
   -- BEPの最重要課題を、IPAを利用して今年度中に片付けたい --
3) BEPの現状整理、課題整理、方針決定
4) IPAを考慮したBEPの仕事分担と作業予定決定
5) 次回ミーティング予定決定
***BEPの反省
****コードの完成度が低い; WinSS、LinuxSS、ELisp m17n
****これらのコードを触れる人が限られている; 渡辺、I、+切明(今年度のホープ)
****コードの完成度を挙げるのが再優先課題
1) WinSS、LinuxSS
2) ELispのBilingual化
3) ドキュメント類
****よきサポータも必要

****<<実施メンバー>>
渡辺(統括、WindowsSS、ELisp)
切明(Linux SSメイン、統括サブ、Lisp、サーバー) ; 今年度のキーになる人
I(Linux SSサブ、Lisp部メイン、サーバー)
吉本(Lisp)
坂本(FAQ、ドキュメント整備、Web整備、ユーザテスト)

南谷(Lispパッケージ、wl、IRC、Ruby)
中村(ドキュメントサブ)
r高橋(ドキュメントサブなどなど)
n高橋(スーパバイザー)
外注(Linux SSエンジン)

ELispパッケージ; ユーザがLispを書く

次回は8/26(日)

;;; Local Variables: ***
;;; mode:Outline ***
;;; End: ***