Google Pixel 3を音声読み上げ環境で使い始めるメモ

あれから10年

2009年6月、Appleが毎年行っている開発者を対象としたカンファレンスであるWWDCで、iPhone 3GSが発表された。基調講演中には取り上げられなかったけれど、この機種に初めてVoiceOverという画面読み上げの機能が導入されたのだ。日本語環境で使えるのかどうかも分からないままにとりあえずソフトバンクのショップに行って即日購入したのは6月25日だったと思う。視覚障碍者にとってのスマートフォン元年とも言うべき年だ。

ご存じの通り、今やスマートフォンはiPhoneだけではない。数としてはAndroidの方が多いだろう。ところが、視覚障碍者のシェアだけを見てみるとほぼほぼiPhoneである。これには明確な理由がある。新しくスマートフォンを持ちたいと思う人にとっての理由とは

  • なんか読み上げ機能はiPhoneが良いらしい
  • 周りに使っている人が多いのはiPhoneだ
  • 友人がiPhoneを勧めてくれた

と言うところではないだろうか。間違っていないと思う。

では、Androidのアクセシビリティはどうなんだろうか。いろいろ情報を探してみると、Googleの公式のヘルプページはたくさん見つかる。が視覚障碍ユーザーが作成したページはかなり少ない。水面下での情報交換は行われているのだろうが、表には出てきていない。

ということで、私がスマートフォンを持ってから10年、Googleが手がけたPixel 3を手に入れたので、ちょっとずつでも情報を公開していこう。

少し時間がかかりそうなので、とりあえず見出しだけ書いておく。随時更新していくつもりである。

開封の儀

あっちこっちで開封の儀は行われているので、私があえて行わなくても良いだろうな。おお?と思ったのは、USBケーブルを巻いて固定するためのものが付いていたことだ。付属品も少ない。

電源投入

電源ボタンを数秒長押しすると電源が入るはずだ。iPhoneの場合は本体左側にあるサイレントスイッチを切り替えると振動するので、電源が入っているかどうかが分かる。が、Pixel 3にはそういうスイッチがない。コンピューターに接続してみると、電源が入っていればデバイスとして認識するから分かるよ、と書いてある記事を発見したが、本当にそうするよりなさそうだ。

私は電源が入ったと信じて次のステップに進んだ。

音声読み上げを起動

Googleのサポートページにも詳しい情報がある。電源が入ったら(そう信じてでも良いが)、2本の指で画面を触ってそのまま指を数秒置いておく。なにやらしゃべり出すので、もっと我慢して数秒置いておく。これでTalkBackが英語でしゃべり出すはずだ。

ここで、Talkbackの基本的な使い方を教えてくれるチュートリアルが起動する。頑張ってこれをやり遂げても良いし、とりあえずスキップしてセットアップに進んでも良い。

セットアップ開始

これも多くのドキュメントがあるので、私が頑張って解説しなくても良いだろう。私はSIMを持っていないのでその辺はスキップする。

iPhoneと違うことと言えば、キーボードの入力方法がタッチ入力になっていることだった。おそらくWi-Fiのパスワードを入力することになるだろうが、その部分で戸惑うかもな、と思う。

いきなり日本語にしちゃだめよ

できれば慣れ親しんだ言語でセットアップを勧めたいところだ。で、言語を日本語にしてみた。ところが!なんとそれ以降読み上げが行われなくなった。日本語の音声がまだ組み込まれていないのだ。どうにか復帰できたが、このままセットアップを諦めようかとも一瞬思った。

ということで、この先は英語で勧めることになる。まあ、macOSのセットアップも英語でやるわけだから、こんなもんか。改善されると良いけれど。

少しだけカスタマイズ

セットアップが終わったら、とにかく英語の状態ではあるがPixel 3が使えるようになったはずだ。まだどういう設定が最適なのかを模索しているところだが、とりあえずやったことだけでも書き残しておこう。

とにかく日本語音声をインストール

AndroidにはGoogle音声読み上げとしていろんな言語の音声が入っている。もちろん日本語もある。まずはこれをインストールしておこう。

言語設定を日本語に

Pixel 3の表示言語を日本語にしておこう。もちろん英語のママでも良いよ。

Talkbackの設定を見直す

それなりにたくさんの設定があるので、いろんなことを試しながら自分が一番使いやすいかなと思う設定を探していく。

  • バイブによるフィードバックはあった方が良いか?
  • 近接センサーを使って音を停止する設定はあった方がよいか?
  • サウンドによるフィードバックはあった方が良いか?

そのたたくさん…

iPhoneとの比較

当たり前なのだが、まだAndroidのタッチスクリーンの癖に馴染めない。なので正当な比較ができない。ただ、分かっているアクセシビリティに関わる比較ならできるかもしれない。

  • サウンドによるフィードバックが効果的に使われている
  • バイブレーションでのフィードバックが多い
  • 電話を切るためのショートカットとして電源ボタンが使える
  • VoiceOverのような音声の乱れはない(VoiceOverユーザなら意味はわかるよね)
  • 日本語入力時の漢字の説明読みは、「Google日本語入力」と入れるか、「ドキュメントトーカー for IME」を導入することで可能にはなる
  • 日本語の漢字説明読みは1文字なら動いているような気がする
  • 入力に関してはキーボードアプリを最適化する余地があるんじゃないかなあ(デフォルトはGboardっていうキーボードだ)
  • 音楽を再生/停止するためのジェスチャーである2本指でダブルタップみたいなものが無いような気がする
  • 複数の指で行うジェスチャーはない(スクロールのために2本指でスワイプするけれど、これはTalkBackのジェスチャーではない模様)
  • SiriでVoiceOverを起動できるような、非常時にTalkBackをなんとか起動させる方法はないのかな?Googleアシスタントさんはやってくれないような気がする

ということで、ちょっとずつAndroidに慣れ親しんでいるところである。

余談だが、私はこれまでApple Musicを使ってきた。手持ちのディスクも一緒に管理したかったし、iTunesがmacOSだとアクセシビリティ的に使いやすかったからだ。で、Pixelの購入をきっかけにGoogle Play Musicに移行してみようと思った。ところが、手持ちのディスクをクラウドにアップロードするためのアプリであるMusic ManagerがmacOSのVoiceOverと一緒には使えなかった。ということで、しばらくはApple Musicかな。

最後に

ぜんぜんAndroidの使い方が分からない。Pixel 3に入っているのはAndroid 9 Pieである。いろいろと変更されたようで、アプリのリストの出し方とかまだまだ調べることがいっぱいだ。ということで、iPhoneと10年付き合ってきた訳なので、ここらで新しいことも始めてみよう。

JAWSとGMailのあれこれ

前書き

今時のWebアプリケーションの代表と言えばGMailかもしれない。あるいはGoogleドキュメントとかそういうものかもしれない。あるいはTwitterとかFacebookとかかもしれない。ひょっとするとエンターテインメント系のアプリなのかもしれない。とにかく、ブラウザの上でアプリケーションが動くというのは当たり前になっている。

これらWebアプリケーションは、スクリーンリーダーユーザーにとって、一般的には使いにくいと言われてきたものたちではないだろうか。これまでスクリーンリーダーは、ブラウザ上に固定的に表示された情報を読み上げることを想定して作られてきた。まさかアプリケーションが動いて、表示内容がころころ書き換わるようなことは想定していなかったのだ。

ずっとまえに、HTML5のアクセシビリティを考える集まりというものが企画されていたのだが、いろんな事情でなくなってしまった、と思う。その後同種の研究や情報交換や規格化は有識者の手で行われてきたし、そのような情報も探せば見つかることだろう。

さて、そういう少し難しい話は置いておいて、実際の所エンドユーザーにとってGMailをブラウザで使ったときと言うのはどの程度使いにくいのか、あるいは使いやすいのかということを考えてみよう。

この検証や私の感覚は、一般的ではないかもしれないし、私が知らないこともたくさんあるだろうと思う。そんなことはない、こんな技術が既にある、こういう研究がされている、なんていう情報があったらぜひ教えてほしい。

試した環境

私の環境をとにかく書いておこう。

  • OS: Windows 10 1803
  • ブラウザ: Google Chrome 71.0.3578.98
  • スクリーンリーダー: JAWS 2018

GMail

これまで簡易HTMLモードが良いと言われていたGMailだが、標準モードにはちゃんとスクリーンリーダー用のサポートが入っているし、とてもたくさんのショートカットキーが用意されている。これらが正しく機能したとすると、かなり使いやすくなることが予想される。

ただ、上述したようにスクリーンリーダーはページが書き換わらないことを想定していた。その書き換わらないページを「仮想バッファ」という状態でユーザーに提示している。メモ帳とかにこのバッファーの内用をコピペすると、実際の表示との差に、視覚的にコンピューターを使っている人は少なからず驚くことだろう。

この仮想バッファーの状態ではキーボード操作はページを読み取るためのキーとして使われている。上下の矢印キーはページを1行ずつ読む竹のキーとして使われる。ところが、GMailのショートカットでは上下の矢印キーはメールのリストを移動するためのキーとして割り当てられている、ごく自然な割り当てだ。

ということで、仮想バッファー状態とそうでない状態の二つを行き来しながらGMailを使うことになる、と言うわけだ。具体的にはこんな感じだろうか。

  • とりあえずGMailのページを表示する
  • InsertキーとZを押して仮想バッファーをオフにする
  • 上下の矢印キーでメールを選ぶ
  • Enterキーを押してメールの本文の表示する
  • InsertキーとZを押して仮想バッファーをオンにする
  • qキーを押してメインリージョンに移動する
  • 上下矢印キーでメールを読む
  • InsertキーとZで仮想バッファーをオフにする
  • uキーを押すとメールのリストに戻れる

なんとも煩雑ではないか。それでも全てを仮想バッファー状態でやるよりは遙かに楽だ。メールの新規作成、返信、転送、フォルダの移動など、使いそうな機能にはショートカットキーが割り当てられているので、メールを読む異界のことは仮想バッファーをオフにして行うのが良いだろう。

最後に

私は日常的にGMailを使うことになっているわけだが、慣れの問題もあるのだろう、結局Emacs+Mewという20年以上使い続けているメール環境の方が作業効率が高いんだろうなと思っている。結局パソコンやスマートフォンは道具である。道具であるならば使い手が使いやすいと感じるものが最良なのだろうな。

とはいえ、こういうWebアプリケーションに対するスクリーンリーダーのサポートはかなり進化してはいる。もう少しブラウザ上で動作するアプリケーションとも仲良くしてみようかな。

JAWSで点字ディスプレイを使っているユーザが快適に使えるターミナル環境

ものすごく特定の人用の情報だな。とりあえず現状のJAWS 2018とWindows7/10でやってみた感じ、一応の結論が出たので書き留めておこう。

環境

  • JAWS 2018
  • Windows 10 April 2018 Update
  • Focus シリーズの点字ディスプレイ
  • macOS 10.14
  • VMWare Fusion

結局 MSYS2

いろんなターミナルソフトがあるけれど、結局MSYS2環境が最も安定しているようだ。

MSYS2のサイト
から適切なインストーラを拾ってきてインストールする。これで環境そのものはできるだろう。

JAWSならではの設定

下記項目を設定しておかないと、正しく日本語が表示できなかったり、文字と文字の間に意味不明な空白がはいったりする。

  • LooksカテゴリーのTransparencyをOff
  • TextカテゴリーのFont Selectボタンを押してフォントをMSゴシックに設定
  • LocaleをJapaneseに設定

後は適当に調整すれば動くはず。

Focus 40 Blue 5th クイックレビュー

前書き

なんのことだ?と思われた人も多いだろう。点字ディスプレイの話である。「点字ディスプレイってなんだ?と思われた方もいらっしゃるだろう。点字が表示されるディスプレイである。

コンピュータにはディスプレイが接続されている。ディスプレイには視覚的に見ることのできる文字が表示されているだろう。ということで、点字が読める人ならばコンピュータに接続できる点字が表示できるディスプレイがあれば、ディスプレイを見ることができなくてもコンピュータが使える、ということになるはずだ。

話はそう単純ではないのだが、とっかかりとしてはそう思っていただいてかまわないだろう。

Focus 40 Blueとは

このディスプレイ、米国のフリーダム・サイエンティフィック社が発売しているものだ。最初の機種がリリースされてからはもう15年くらいになるだろうか。最初のものはかなり大きなものだったなと言う記憶がある。

昨年12月に日本でも発売された。詳しい製品情報は
エクストラ社の製品ページ
をご覧頂くとして、どんなディスプレイなのか簡単に書いてみよう。

  • 40セルの点字表示部
  • 8個の点字入力用キー
  • 文書の移動や表示位置を変更するためのナビゲーションキー
  • その他のキー
  • USB-Cコネクター
  • Bluetooth接続(複数台登録できる)

といったところだ。USB端子がUSB-Cなので、端子の向きを考えなくて良くなったのは地味に便利だ。

さて、ソフトウェア的に見るとこのディスプレイには、大きく分けて三つの機能がある。

  • コンピュータの画面を点字として表示する機能
  • コンピュータのキーボードとして振る舞う機能
  • 単体としてテキストデータを編集する機能

以下、それぞれについて簡単にレビューしてみよう。

コンピュータの画面を点字として表示する機能

この部分は、これまでのFocusシリーズと基本的には変わらない。それぞれの点字セルの上にルーティングキーがあるのも同じだ。かつては二組のルーティングキーを備えたものもあったけれど、結局1段一組に落ち着いているようだ。日本のユーザは「タッチカーソル」と呼んだ方が馴染みがあるだろうか。

このルーティングキー、点字ディスプレイに表示されている文字やアイコン(を文字にしたもの)の向こう側のキーを押すと画面上の対応する部分を左クリックしてくれる、というものだ。使い慣れるとなかなか便利である。

コンピュータの表示装置として使用するには、対応するソフトウェアをインストールする必要があり、結局のところ、表示装置として使いやすいかどうかはこのソフトウェアに依存するところが大きい。私は普段 
JAWS
を使っているのだが、その他のソフトウェアだと必ずしも表示装置としての機能を100パーセント使えていないのが現状だ。

コンピュータのキーボードとして振る舞う機能

こちらはインストールしているソフトウェアに強く依存する。キーボードとしてはほとんど使えないソフトからJAWSのようにWindowsで普段行うような操作のほとんどが点字ディスプレイを使って行うことができるものまで様々だ。コマンドが多くて覚えるのが大変なのだが、基本的な編集操作やダイアログボックスの操作、アプリケーションの起動といったことも点字ディスプレイから手を離さずにできる。

文字入力は、残念ながら日本語に対応していない。英語であれば完全に入力できるのだけどな。

単体としてテキストデータを編集する機能

このディスプレイの目玉機能がこれだ。誤解を恐れずに言うなら
ブレイルメモ
的な機能が搭載された。扱えるファイルはASCIIテキスト(正確にはNABCCテキストと言うべきか?)だけなので、点字のデータを編集するのには使えるだろう。想定としては、簡単なメモを取ることだ。取ったメモは点字なのでそのままでは扱いにくい。なんとか日本語の漢字仮名交じりに変換できれば利用価値は一気に大きくなる。

とはいえ、例えばミーティングに出席するとかでメモを取りたいときなどにはかなり重宝するはずだ。通常の点字ディスプレイからメモ機能への移行はとても簡単だ。また、ファイルは点字ディスプレイに装着したMicro SDに保存されるため、たくさんのファイルを持ち歩ける。

一通りの編集機能はあるため、メモを作るくらいならば困らないだろう。そのうちファイルをまたいだ検索なんかにも対応してくれると良いな。

最後に

気の向くままに書いてきたのでわかりにくいかとは思う。気になる方は実際に触って見られるのが良いだろう。11月には
サイトワールド
も開催される。

ということで、私は返却してしまったので、ちょっと前のFocusを使うことにしよう。