[Prev]-[TOC]-
[Next]
(Linux Conference 2000、2000年11月30日、京都国際会館)
Bilingual Emacspeakと
視覚障害者のLinuxアクセシビリティ向上
Bilingual Emacspeak Project (BEP) のメンバー
渡辺 <watanabe@argv.org>、井上<inoue>、坂本、切明、白藤、本多、西本、釜江、他
- はじめに;視覚障害者のコンピュータ利用
- Bilingual Emacspeak Project
- BEPの概要、Emacspeakの紹介
- 日本語の音声化に必要な機能
- バイリンガルEmacspeakとバイリンガルスピーチサーバ
- BEPの試用と予定、デモ
- Linuxのユニバーサルデザイン
- Linuxのアクセシビリティ
- 晴眼者と視覚障害者のユニバーサルワークプレイス
[Prev]-[TOC]-
[Next] ;p.02
障害者とコンピュータ
- IT時代;コンピュータとネットワークの急速な普及
- パソコン;個人用のコンピュータ
- GUI OS (MS Windowsなど);初心者でも使える
- インターネットの普及;電子メール、WWW
- デジタルデバイド
- ITを利用できない人が取り残される;高齢者、障害者、貧困、...
- 日本は高齢化社会に突入
- 2015年には4人に1人は高齢者;
あなたも高齢者=障害者!?
- ITを支援技術として用いる
- コンピュータに文字を読み上げさせれば視覚障害者も文字情報を利用可能
[Prev]-[TOC]-
[Next] ;p.03
コンピュータによる文字の読み上げ
- DOS:command.comに文字で指示、文字で結果出力
- DOS用スクリーンリーダ
- テキスト画面をスキャンして音声化すべき情報を取得
- DOSでは最新のデバイスや技術を使いにくい
- Windows:GUIは晴眼者には便利
- Windows用スクリーンリーダ
- 視覚障害者が使えないアプリケーションがある
- 取得できる情報が少ないので、DOS用スクリーンリーダを常用している人もいる
- UNIX系OS (PC-UNIXなど):高機能なネットワークOS
- UNIX用スクリーンリーダ
- テキストコンソールで使えるので、DOSからUNIXへの方が移行しやすいはず
- 日本語スクリーンリーダはなく、音声化リモート端末からしか利用できない
[Prev]-[TOC]-
[Next] ;p.04
- BEPの概要
- GNU Emacs
- Raman博士のUNIX音声化システムEmacspeak
- GUIとAUI (Auditory User Interface)
- 日本語を音声化するときに必要な機能
- Emacspeakの多言語化作業
- Linux用の日本語音声合成エンジン及びバイリンガルスピーチサーバの開発
- BEPの現状;内部ユーザが試用
- BEP一般公開への道筋
- BEPの将来
[Prev]-[TOC]-
[Next] ;p.05
Bilingual Emacspeak Project (BEP)の概要
- BEPの目的
- 日本の視覚障害者が仕事や研究や高等教育の場で使うシステム
- BEP = Emacspeak(後述)+2カ国語 & Linux SS+Windows SS
- 2カ国語;日本人の知的活動には英語も日本語も必要。
日本語の発音では長文の英文を聞くに耐えない。[Windows版でデモ]
- Windows;個人用OSとして最も普及している
- Linux;仕事でUNIXを使う、GNU/LinuxはアクセシブルなOSになるかも
- BEPのメンバー
- Emacsが好きな晴眼者と視覚障害者、ARGVのBEP MLで開発 (オープン)
- BEPの効能
- WindowsでもLinuxでも、モバイルノートでも、使い慣れたEmacsで作業できる
[Prev]-[TOC]-
[Next] ;p.06
GNU Emacs;これさえあれば仕事も勉強もOK!
- UNIXで標準的なテキストエディタ
- Unix、Windows、Macintosh、DOSなど各種OSで動作
- Emacs Lispで機能拡張ライブラリ、フルカスタマイズ可能
テキスト編集、電子メール、WWW、ファイラー、shell、端末、PIM、…
LaTeXで論文作成、C++でプログラミング、何でもできる
- Emacs 20.* は多言語対応
- Emacs Lispは立派なプログラム言語、
テキストBufferの情報を自在に加工できる
- GNU、オープンソース文化
Raman; Emacsを音声化して自分用の音声化システムを開発
[Prev]-[TOC]-
[Next] ;p.07
Raman博士のUNIX音声化システムEmacspeak
- 特徴
-
- Emacs (Emacs Lispライブラリ)がスピーチサーバを制御
- OSの表示情報を音声化するスクリーンリーダと異なり小気味よい操作性
- Emacsという高機能な"環境"を音声利用できる
- AUI (Auditory User Interface)
-
- AUI + GUI;UIをアプリ本体と分離し、ユーザに適合したUIを使用 [AUIのデモ]
- 音声フォントなどで表現力を増す
[Emacspeakでaudio queueとW3のデモ]
- (欠点)
-
- Emacsを知らなければ使えない
- UNIX以外のOSを考慮していない
- 英語のみ
- 高機能なハードウェア音声合成装置DECtalkを想定したコマンド体系
[Prev]-[TOC]-
[Next] ;p.08
日本語音声化に必要な機能;説明読み
漢字は表意文字、複数の同音異義語がある;漢字、感じ、幹事、...
[各種読み上げのデモ]
- かな漢字変換時
- 簡明な説明 と わかりやすい説明(検討中)
「亜」;アジアノ ア
- カーソル移動時
- 「亜」;ア
- 文節単位の読み上げ
- 「前のユーザに」;マエノ カタカナ ユーザ ニ
- 文の読み下し
- 基本的に日本語音声合成エンジンに任せる
[Prev]-[TOC]-
[Next] ;p.09
日本語音声化に必要な機能;音声フォント
耳で聞くと、ひらがなとカタカナ、大文字と小文字、全角と半角を区別不能
- 文字種別を説明
- 「カ」;カタカナノ カ、
「A」;オオモジ エー
- 音声フォント
- 声の種類やピッチを変える、全角と半角の場合は日米の声を使い分ける
- audio queue
- 特有の短い音で合図する
「ひらがなとカタカナ」;ヒラガナト ピ! カタカナ
[Prev]-[TOC]-
[Next] ;p.10
Emacspeakのローカライズ、多言語化
まずは日本語と英語を扱えるようにする。
ただし将来多言語に拡張するときのことも配慮する。
- Emacs 20.4 + egg 4、eggレベルでかな漢字変換を音声化
- 言語の判断;elisp (予定;課題のひとつ)
現在はシフトJISのLeadingByteを見てスピーチサーバで判断
Emacsで判断すれば文字コード以外の情報を使えるので正確に判断可能、
多言語化も容易
- 読み上げ可能文字、説明読み(punctuation)の多言語化
[Prev]-[TOC]-
[Next] ;p.11
バイリンガルスピーチサーバへの要求
- バイリンガルな音声合成エンジンは存在しない
- ・日米2つの音声合成エンジンを切り替えて音声化
- 言語によってエンジンの仕様が異なる
- ・差を吸収
- Linux用の日本語音声合成エンジンがない
- ・クリエートシステム開発の開発キットから作成
- Linuxには音声合成の統一インターフェースがない
(WindowsにはMS SAPIという統一インターフェースも日本語エンジンもある)
- ・自前で用意
[Prev]-[TOC]-
[Next] ;p.12
Linux版スピーチサーバ
まだ日本語しか喋れない。英語はカタカナ英語。
- 仕組み [ss1のデモ]
- 「コマンド+読み上げ文字列」を標準入力で受け取り、コマンド解釈やスレッド操作などのスレッドと、文字列音声化のスレッドを走らせる。
- 英語音声合成エンジン
- IBM ViaVoice Outloud [Outloudのデモ] 又は フリーなFestival
- 日本語音声合成エンジン
- クリエートシステム開発(株)のLinux版音声合成SDK(PCMを吐くだけ)を使用
- esoundのミキシングに対応
- 音声の即時停止;レスポンスが良くないと実用的でない
[Prev]-[TOC]-
[Next] ;p.13
[Linux版のデモ]
- AUIによるカレンダーの音声化 (済)
- Audio Queue;空白行、大文字、インデント、... (済)
- 日本語の音声化、詳細読み (済)
- 基本編集操作
- 文字や単語単位の読み上げ、行の読み上げ
- 英語のカタカナ読み
- esoundによる音声出力とaudio queueの同時再生
- コンテキストに応じた声の使い分け voice-font-lock
- 具体例で以上の特徴をお見せします;
[Prev]-[TOC]-
[Next] ;p.14
BEPの現状、試用
- Windows版、Linux版とも開発中
- BEP ML内部では公開。視覚障害者が一人で使用できるレベル。
- Windows版 (バイリンガル)
- WindowsでもEmacs、Mewを音声利用できるのが好評。長い英語も聞きやすい。
- Linux版 (まだ日本語のみ)
- Linuxノートを持ち歩いて、いつでもどこでもEmacsを音声利用可能。画期的!
- BEPの現在の想定ユーザ像 (効率優先)
- ARGVのメンバー、Emacsを音声利用したい人
[Prev]-[TOC]-
[Next] ;p.15
BEPの予定
- 一般公開
- 自主開発部はオープンソース、音声合成エンジンは別配布
- インストーラ、ドキュメント、Emacsを知らないユーザへの配慮が必要
- 点字出力
- ソースコードの2次元配置を把握するために必要とするユーザもいる
- 多言語に拡張
- 韓国語、中国語、ヨーロッパなど
- 音声認識と併用
BEP 参加者募集中!
MLの参加方法は、http://www.argv.org/bep/ml
参照
[Prev]-[TOC]-
[Next] ;p.16
Part III;Linuxのユニバーサルデザイン
- アシスティブテクノロジー; BEP
- 支援技術
- アクセシビリティ
- 障害者が使いやすいこと。
例;視覚障害者がアクセスしやすいWebとは、文字で情報を得ることができるWebページ。
階段を使わなくても出入りできる建物はアクセシブルな建物。
- バリアフリー
- 障害を取り除くこと
- ユニバーサルデザイン (UD)
- できるだけ多くの人のためのデザイン。設計の初期段階から幅広い利用者を考えて、不注意や考慮不足で利用者を限定しないようにデザインする。
[Prev]-[TOC]-
[Next] ;p.17
ユニバーサルデザインの7原則
「ユニバーサルデザインとは何か」 古瀬敏著、都市文化社選書
できる限り最大限すべての人が利用可能できるように、製品、建物、空間をデザインする。年齢、性別、障害などの理由で利用者を差別しない。
- 誰にでも公平に使用できること
- 使う上での自由度が高いこと
- 簡単で直感的に分かる使用方法となっていること
- 必要な情報がすぐ理解できること
- うっかりエラーや危険につながらないデザインであること
- 無理な姿勢や強い力なしで楽に使用できること
- 接近して使えるような寸法・空間となっていること
[Prev]-[TOC]-
[Next] ;p.18
ソフトウェアのアクセシビリティ向上
情報とユーザインターフェースを分離すべし
- WindowsはGUIと一体
- スクリーンリーダはGUIを使わないと情報を取得できない
携帯機器の狭い画面でもGUIは使いにくい
初心者や幼児や高齢者はマウスが使えない。
- UNIXはGUIと分離している
- GUIツールを使わなくても、エディタで直接編集してシステムを管理できる。
- GUIとAUI
- AUIが音声化に適しているのは当たり前。でも晴眼者は使いにくいかも。
テキストベースならGUIでもAUIでも使いやすい。
[Prev]-[TOC]-
[Next] ;p.19
Linuxのアクセシビリティ
- Linuxの大衆化 = 使えればよい(Windows-like)ユーザの増加
- GUIだけでしか操作できない状況にならないようにして欲しい!
- GNOME
- Sun Micrsosystemsは、GNOMEにGNOME Accessibility Interfaceを追加してアクセシブルなGTK Widgetsを作ろうとしている;http://www.sun.com/access/gnome/
- Linuxのアクセシビリティ
- 日本でもLinuxのアクセシビリティ、ひいてはユニバーサルデザインを真剣に考えませんか? (自力インストールや自力初期設定への配慮など)
多様なユーザがLinuxに注目しています。バイリンガルで喋るLinux、キーボードだけで操作できるLinux、障害者だけでなく健常者にも使いやすくなりますよ。
[Prev]-[TOC]-
[Next] ;p.20
視覚障害者と晴眼者の
ユニバーサル・ワークプレース
- 同じアプリケーションを使う
- 特殊なアプリでは仕事に使えない。共同作業できない。
- ユーザーの特性に合わせたUIで使い分ける;GUIとAUI
- ユーザーに合わせてカスタマイズ
- ユーザーの特性に適合;オーディオフィードバックのレベルなど
- テキストベースで情報処理
- 理工系の仕事や研究で処理する情報のほとんどは文字で表現可能
- 仕事や研究で必要な機能をサポート
- Emacsでほとんどカバーできる
[Prev]-[TOC]-
[Next] ;p.21
晴眼者と視覚障害者の音声利用の比較
音声出力は、視覚も聴覚も使える晴眼者にも利益があることは間違いない。しかし晴眼者と視覚障害者の音声利用には大きく異なる点もある。
- 音声出力の特徴
- 眺望感がない、sequential 1-dimensional stream
- 斜め読みやブラウジングが出来ない。
- 読み上げる方が目で読むよりも時間がかかる
- 視覚障害者にとっての音声利用;伝達速度の速さが重要
- 視覚障害者は倍速程度で再生。(文字コードとしての音声)
- 慣れた視覚障害者は余分な情報の音声化を嫌がる。
- 晴眼者にとっても音声利用;慣れていないので不安
- 倍速では聞き取れない
- 単調な音声合成は飽きてしまう
- 不要な情報もフィードバックしないと不安。目でちょっとカンニングすればかなりの情報量を補える
[Prev]-[TOC]-
[Next] ;p.22
まとめ
- コンピュータは障害者の支援技術として使える
- GUIしかないWindowsは音声化に適していない
- UNIXはWindowsに代わる高機能OSだが日本語音声化システムがない
- この状況を打開するためにBilingual Emacspeak Projectを立ち上げた
- Emacsが好きな晴眼者と視覚障害者のオープンな集まり
- Emacspeakを日米2カ国語に拡張、WindowsでもLinuxでもEmacsを音声利用できるので、仕事や研究でEmacsを使う日本の視覚障害者の支援技術となる。
- ML内部では使用中。早期の一般公開を目指している。
- LinuxをアクセシブルなOSにしよう。
このスライドや論文などの公開URL:
http://www.argv.org/bep/doc/
BEP MLの参加方法: bep-subscribe@argv.org に空のメールを送る。
[Prev]-[TOC]-
[Next] ;p.23
リンク集
- BEP関連
-
- Emacspeak関連 (英語)
-
- スクリーンリーダ
-
- その他 アクセシビリティ関連
-
スライド目次
- Part I; はじめに
- Part II; Bilingual Emacspeak Project
- Part III; Linuxのユニバーサルデザイン
- 22; まとめ
- 23; リンク集
Last Updated; November 28, 2000
By T. Watanabe