今日になって急に、Mac OSで音声入力をする動画を作ってみたらおもしろいのではと思い立った。音声入力をしたいのではなくて「その経過を動画にしたい」というところが目的地点なわけだが、1〜2時間も練習すればおもしろいものになるかと思った思惑は現在のところ外れ、思いがけない場所で苦戦中。
音声入力をしたことがない人のために、下準備を書いておく。
まずMac OSのシステム環境設定から「キーボード」で音声入力を使う、に設定。そのあと同じく環境設定の別欄「アクセシビリティ」から、英語と日本語で高度な入力コマンドを使う、にチェックを入れる。これで準備は完了である。ここまでは以前から設定済みで、多少の実験をしたこともあった。
さて、音声入力だ。
まずテキストエディタなどを立ち上げてある状態で、fnキーを2回押して音声入力を呼び出す。コマンドは英語のほうがわかりやすそうだったので、まずは英語で試してみた。
音声入力例:
Good morning period This is (person A) calling from Tokyo comma
can I speak to Mr. (person B) question mark
これがうまくいけば、以下に変換される予定:
Good morning. This is (person A) calling from Tokyo, can I speak to Mr. (person B)?
で、わたしがのっけから躓いたのは、非英語圏の人名を「どうスペリングで表現するか」である。いくらアルファベットを発音してもシステムは単語として受けとろうとする。たとえばT(ティー)と言えばteaなど、それらしい単語を出してくる。
コマンドの no space on をスペルの前に言うことで、それ以下のアルファベットをそのまま書けという意味になるらしいと読んだ。それがうまくいった場合であっても、すべてキャピタル(大文字)で表現されてしまう。たとえば人名が田中さんであった場合、もし文字が入力できた場合でも、TANAKAにしかならない。tanakaやTanakaの方法がわからなない。それらしきコマンド(大文字小文字関連)を組み合わせても、まだ解決できていない。
次に、literalというコマンドを使ってみた。これも「文字通り」という意味のはずなので使えるだろうと思ったが、no space onより言いやすいだけで、出力結果はほぼ同じ。ただ、言いやすいのは間違いなくこちらなので、今後はliteralを使っていこうとは思っている。
さて、しつこく書いてしまうが、いくら文字をそのまま打てというコマンドであっても、非英語圏の文字の羅列をそのまま通してよいのかとシステムが悩んでしまうようだ。なんとか意味をとろうとして羅列ではなく単語風に出力したがるように思う。つまり英語圏で需要がありそうなABCDEやXYZならば文字の羅列であってもかなりの確率で入力してくれるが、日本人の人名ではまず無理。スペルでと言っているのに、あまり似ていないが単語っぽく見える何かを表示してくる。
さらに、英語圏で問題なさそうなABCDEであっても、ABCDの4文字でいったん区切って半角スペースのあとにEが来ることが圧倒的に多い。文字だけをつないだら4文字くらいでいったん切りたいでしょうユーザーさん、切ってあげましたよという「無駄サービス」なのだろうか。そう考えるとちょっと微笑ましい——いや、笑っている場合ではない。
日本語ユーザ以外でも、苦労はあるようだ。英語圏で馴染みがある人名であっても、スペルがMacおすすめのものと違う場合の訂正がたいへんらしいと、英語圏の掲示板で読んだ。たとえば日本語の「アン」さんは、人によってはAnnかもしれないし、最後にeがくるかもしれない。違うものが表示されたときにキーボードから候補を選ぶのではなくて音声で訂正する必要がある場合、今回のわたしと同じような苦労をしなければならないのは、英語圏の人も同じなのだ。それを思うと、手がうまく使えないなど身体的に事情がある人が、キーボードにまったく触れずに音声入力ができるかどうかの問題にもなってくる。そういった方々は、どうされているのだろう。別途有料のソフトでも購入しているのか。
ちなみに同じ音声入力といっても、iPhoneのほうでは、やや精度が高いように感じた。句読点や記号などの違いはまだ細部まで試していないが、手持ちの英語ペーパーバックで適当な場所を1段落ほど読み上げたところ、iPhoneのほうではぱっと見で8割以上が正しく入力されていた。同じものがMac OSでは7割以下の印象。同じ文面を適当に読んだ条件は同じであり、わたしの発音の問題ではないと思われる。ただどちらも人名には弱いようだ。PhillipとNancyが出てくるが、Nancyはたまに成功したものの、Phillipはどこの場所に出てきても別の単語に置き換えられてしまった。
聞き取れないものがあったとき、少しでも文章として成立しそうな別単語をつなぎ合わせてしまう癖が、Mac OSのほうでも、iOSのほうでもあるように思う。
まさかとは思うが、Phillipというそこそこメジャーな人名に関して、わたしの発音がおかしい可能性があるかどうか、明日にでもチェックしてみなくてはならない。