Google Pixel 3を音声読み上げ環境で使い始めるメモ

あれから10年

2009年6月、Appleが毎年行っている開発者を対象としたカンファレンスであるWWDCで、iPhone 3GSが発表された。基調講演中には取り上げられなかったけれど、この機種に初めてVoiceOverという画面読み上げの機能が導入されたのだ。日本語環境で使えるのかどうかも分からないままにとりあえずソフトバンクのショップに行って即日購入したのは6月25日だったと思う。視覚障碍者にとってのスマートフォン元年とも言うべき年だ。

ご存じの通り、今やスマートフォンはiPhoneだけではない。数としてはAndroidの方が多いだろう。ところが、視覚障碍者のシェアだけを見てみるとほぼほぼiPhoneである。これには明確な理由がある。新しくスマートフォンを持ちたいと思う人にとっての理由とは

  • なんか読み上げ機能はiPhoneが良いらしい
  • 周りに使っている人が多いのはiPhoneだ
  • 友人がiPhoneを勧めてくれた

と言うところではないだろうか。間違っていないと思う。

では、Androidのアクセシビリティはどうなんだろうか。いろいろ情報を探してみると、Googleの公式のヘルプページはたくさん見つかる。が視覚障碍ユーザーが作成したページはかなり少ない。水面下での情報交換は行われているのだろうが、表には出てきていない。

ということで、私がスマートフォンを持ってから10年、Googleが手がけたPixel 3を手に入れたので、ちょっとずつでも情報を公開していこう。

少し時間がかかりそうなので、とりあえず見出しだけ書いておく。随時更新していくつもりである。

開封の儀

あっちこっちで開封の儀は行われているので、私があえて行わなくても良いだろうな。おお?と思ったのは、USBケーブルを巻いて固定するためのものが付いていたことだ。付属品も少ない。

電源投入

電源ボタンを数秒長押しすると電源が入るはずだ。iPhoneの場合は本体左側にあるサイレントスイッチを切り替えると振動するので、電源が入っているかどうかが分かる。が、Pixel 3にはそういうスイッチがない。コンピューターに接続してみると、電源が入っていればデバイスとして認識するから分かるよ、と書いてある記事を発見したが、本当にそうするよりなさそうだ。

私は電源が入ったと信じて次のステップに進んだ。

音声読み上げを起動

Googleのサポートページにも詳しい情報がある。電源が入ったら(そう信じてでも良いが)、2本の指で画面を触ってそのまま指を数秒置いておく。なにやらしゃべり出すので、もっと我慢して数秒置いておく。これでTalkBackが英語でしゃべり出すはずだ。

ここで、Talkbackの基本的な使い方を教えてくれるチュートリアルが起動する。頑張ってこれをやり遂げても良いし、とりあえずスキップしてセットアップに進んでも良い。

セットアップ開始

これも多くのドキュメントがあるので、私が頑張って解説しなくても良いだろう。私はSIMを持っていないのでその辺はスキップする。

iPhoneと違うことと言えば、キーボードの入力方法がタッチ入力になっていることだった。おそらくWi-Fiのパスワードを入力することになるだろうが、その部分で戸惑うかもな、と思う。

いきなり日本語にしちゃだめよ

できれば慣れ親しんだ言語でセットアップを勧めたいところだ。で、言語を日本語にしてみた。ところが!なんとそれ以降読み上げが行われなくなった。日本語の音声がまだ組み込まれていないのだ。どうにか復帰できたが、このままセットアップを諦めようかとも一瞬思った。

ということで、この先は英語で勧めることになる。まあ、macOSのセットアップも英語でやるわけだから、こんなもんか。改善されると良いけれど。

少しだけカスタマイズ

セットアップが終わったら、とにかく英語の状態ではあるがPixel 3が使えるようになったはずだ。まだどういう設定が最適なのかを模索しているところだが、とりあえずやったことだけでも書き残しておこう。

とにかく日本語音声をインストール

AndroidにはGoogle音声読み上げとしていろんな言語の音声が入っている。もちろん日本語もある。まずはこれをインストールしておこう。

言語設定を日本語に

Pixel 3の表示言語を日本語にしておこう。もちろん英語のママでも良いよ。

Talkbackの設定を見直す

それなりにたくさんの設定があるので、いろんなことを試しながら自分が一番使いやすいかなと思う設定を探していく。

  • バイブによるフィードバックはあった方が良いか?
  • 近接センサーを使って音を停止する設定はあった方がよいか?
  • サウンドによるフィードバックはあった方が良いか?

そのたたくさん…

iPhoneとの比較

当たり前なのだが、まだAndroidのタッチスクリーンの癖に馴染めない。なので正当な比較ができない。ただ、分かっているアクセシビリティに関わる比較ならできるかもしれない。

  • サウンドによるフィードバックが効果的に使われている
  • バイブレーションでのフィードバックが多い
  • 電話を切るためのショートカットとして電源ボタンが使える
  • VoiceOverのような音声の乱れはない(VoiceOverユーザなら意味はわかるよね)
  • 日本語入力時の漢字の説明読みは、「Google日本語入力」と入れるか、「ドキュメントトーカー for IME」を導入することで可能にはなる
  • 日本語の漢字説明読みは1文字なら動いているような気がする
  • 入力に関してはキーボードアプリを最適化する余地があるんじゃないかなあ(デフォルトはGboardっていうキーボードだ)
  • 音楽を再生/停止するためのジェスチャーである2本指でダブルタップみたいなものが無いような気がする
  • 複数の指で行うジェスチャーはない(スクロールのために2本指でスワイプするけれど、これはTalkBackのジェスチャーではない模様)
  • SiriでVoiceOverを起動できるような、非常時にTalkBackをなんとか起動させる方法はないのかな?Googleアシスタントさんはやってくれないような気がする

ということで、ちょっとずつAndroidに慣れ親しんでいるところである。

余談だが、私はこれまでApple Musicを使ってきた。手持ちのディスクも一緒に管理したかったし、iTunesがmacOSだとアクセシビリティ的に使いやすかったからだ。で、Pixelの購入をきっかけにGoogle Play Musicに移行してみようと思った。ところが、手持ちのディスクをクラウドにアップロードするためのアプリであるMusic ManagerがmacOSのVoiceOverと一緒には使えなかった。ということで、しばらくはApple Musicかな。

最後に

ぜんぜんAndroidの使い方が分からない。Pixel 3に入っているのはAndroid 9 Pieである。いろいろと変更されたようで、アプリのリストの出し方とかまだまだ調べることがいっぱいだ。ということで、iPhoneと10年付き合ってきた訳なので、ここらで新しいことも始めてみよう。

JAWSとGMailのあれこれ

前書き

今時のWebアプリケーションの代表と言えばGMailかもしれない。あるいはGoogleドキュメントとかそういうものかもしれない。あるいはTwitterとかFacebookとかかもしれない。ひょっとするとエンターテインメント系のアプリなのかもしれない。とにかく、ブラウザの上でアプリケーションが動くというのは当たり前になっている。

これらWebアプリケーションは、スクリーンリーダーユーザーにとって、一般的には使いにくいと言われてきたものたちではないだろうか。これまでスクリーンリーダーは、ブラウザ上に固定的に表示された情報を読み上げることを想定して作られてきた。まさかアプリケーションが動いて、表示内容がころころ書き換わるようなことは想定していなかったのだ。

ずっとまえに、HTML5のアクセシビリティを考える集まりというものが企画されていたのだが、いろんな事情でなくなってしまった、と思う。その後同種の研究や情報交換や規格化は有識者の手で行われてきたし、そのような情報も探せば見つかることだろう。

さて、そういう少し難しい話は置いておいて、実際の所エンドユーザーにとってGMailをブラウザで使ったときと言うのはどの程度使いにくいのか、あるいは使いやすいのかということを考えてみよう。

この検証や私の感覚は、一般的ではないかもしれないし、私が知らないこともたくさんあるだろうと思う。そんなことはない、こんな技術が既にある、こういう研究がされている、なんていう情報があったらぜひ教えてほしい。

試した環境

私の環境をとにかく書いておこう。

  • OS: Windows 10 1803
  • ブラウザ: Google Chrome 71.0.3578.98
  • スクリーンリーダー: JAWS 2018

GMail

これまで簡易HTMLモードが良いと言われていたGMailだが、標準モードにはちゃんとスクリーンリーダー用のサポートが入っているし、とてもたくさんのショートカットキーが用意されている。これらが正しく機能したとすると、かなり使いやすくなることが予想される。

ただ、上述したようにスクリーンリーダーはページが書き換わらないことを想定していた。その書き換わらないページを「仮想バッファ」という状態でユーザーに提示している。メモ帳とかにこのバッファーの内用をコピペすると、実際の表示との差に、視覚的にコンピューターを使っている人は少なからず驚くことだろう。

この仮想バッファーの状態ではキーボード操作はページを読み取るためのキーとして使われている。上下の矢印キーはページを1行ずつ読む竹のキーとして使われる。ところが、GMailのショートカットでは上下の矢印キーはメールのリストを移動するためのキーとして割り当てられている、ごく自然な割り当てだ。

ということで、仮想バッファー状態とそうでない状態の二つを行き来しながらGMailを使うことになる、と言うわけだ。具体的にはこんな感じだろうか。

  • とりあえずGMailのページを表示する
  • InsertキーとZを押して仮想バッファーをオフにする
  • 上下の矢印キーでメールを選ぶ
  • Enterキーを押してメールの本文の表示する
  • InsertキーとZを押して仮想バッファーをオンにする
  • qキーを押してメインリージョンに移動する
  • 上下矢印キーでメールを読む
  • InsertキーとZで仮想バッファーをオフにする
  • uキーを押すとメールのリストに戻れる

なんとも煩雑ではないか。それでも全てを仮想バッファー状態でやるよりは遙かに楽だ。メールの新規作成、返信、転送、フォルダの移動など、使いそうな機能にはショートカットキーが割り当てられているので、メールを読む異界のことは仮想バッファーをオフにして行うのが良いだろう。

最後に

私は日常的にGMailを使うことになっているわけだが、慣れの問題もあるのだろう、結局Emacs+Mewという20年以上使い続けているメール環境の方が作業効率が高いんだろうなと思っている。結局パソコンやスマートフォンは道具である。道具であるならば使い手が使いやすいと感じるものが最良なのだろうな。

とはいえ、こういうWebアプリケーションに対するスクリーンリーダーのサポートはかなり進化してはいる。もう少しブラウザ上で動作するアプリケーションとも仲良くしてみようかな。