音声入力について
音声入力について
ここ最近ブログを書く際は、ワードの音声入力を用いてやっていた。今回も上半分のほとんどは音声入力だ。
初めたきっかけは前も書いたが、X(旧Twitter)で「会議録みたいな論文作成は音声入力のほうが速いよ」って言ってる外国人がいた、というポスト(旧tweet)を見たからだ。
論文を書くなんて、内容よりも「えっと」のほうが多くなりそうなので絶対無理。
じゃあまあ、自分が好きに書けるブログからやってみるかと思った。
ポスト(旧tweet)が音声で文字に変換されたら良かったけど、あれは音声ファイルとして送られるからやだ。
iPhoneとwordの音声入力
自分が持ってるデバイスで、音声入力が簡単にできるものはふたつあった。
ひとつがiPhoneで、もう1つがword。
前回のパラノマサイトのやつはiPhoneで
その前のジョジョ9部がword。
正直iPhoneで入力したほうが楽なように思う。
読点や句読点も、こちらの都合というか、読むスピードによって入れてくれる。変換に関しても、最初はおかしいと思うようなものがあっても、その後でAIが修正してくれる。音が飛んでしまった場合には直すこともあるが、それ以外についてはあまり直す必要がない。
ただし、パラノマサイトと言う固有名詞に関しては、いちども聞きとってくれなかったため、知名度(とか最新のものはデータベース化してない)なのかもしれない。
それか、iPhoneの変換履歴からサジェストされてるか。
変換履歴からサジェストされてるなら、自分がよく使う単語は出力しやすくなるだろうから願ったり叶ったりだ。
ということで、固有名詞についてiPhoneの音声入力がどれくらいの精度なのか試してみた。
どれくらい固有名詞を音声入力は認識してくれるのか
●読む言葉
1. 空条承太郎
2. ハバタクカミ
3. チルノのパーフェクトさんすう教室
4. 青眼の究極竜(読みはもちろん「ブルーアイズアルティメットドラゴン」)
6. 恋符マスタースパーク
8. サーフゴー
9. 急性巣状細菌性腎炎(ちゃんとある言葉なのに、google日本語入力でも全然変換してくれなかった。そして固有名詞ではないが専門用語なのでピックアップした。)
ぱっと思い浮かんだ単語を傾向の吟味もせずに音読したのでかなり偏りがある。考えていないので当たり前だが、自分らしい単語になった気がする。(最後のは何?)
●iPhoneで読んだ結果
1. 空条承太郎 →正解!
2. 羽ばたく紙 →音としては正解。
3. チルノのパーフェクト、算数教室 →音としては正解。
4. ブルーアイズアルティメットドラゴン →音としては正解。
5. スリジャヤワルダナプラコッテ →正解!
6. 恋符マスタースパーク →正解!
7. ゼルダの伝説、ティアーズオブザキングダム →正解!
8. サーフ号 →音としては正解。
9. 急性相乗、最近、精神 →????
考察(以下は手打ち)
音の認識
8/9問は音としては正確に認識していて、有名な単語、固有名詞なら漫画のキャラクターでもしっかり変換されることがわかった。恋符までしっかり変換されたのはかなり驚いた。
一方で、青眼の究極竜のようなルビ系には対応していないみたい。google日本語入力でもブルーアイズアルティメットドラゴンでは感じには変換されなかったし、そこまで求めるのは酷な気がする。
最後のは普通に入力してても変換されなかったから仕方ない。
変換はなにに基づいているか
僕のiPhoneはポケモンをやりまくってるせいで頭文字二文字とかでサジェストされる。
(iPhoneのスクショ、でっかいな……)
自分のiPhoneの検索履歴から音声入力が反映されるなら、ポケモン2匹はすべからく変換されるべきだ。なので、何をデータベースにしているかは知らないけどiPhoneに初期から実装されている辞書かなんかにアクセスしていると考えるのが良さそうだ。
おわりに
音声入力、新しい技術を使っている(実際にはもっと前から確立されていそう)感じで楽しいので有効活用していきたい。技術は使わないとなれないしね。
ポケモン対戦のデータ処理にうまく使えるといいんだけど。対戦しながらPC画面見て、相手のPTメモするの面倒ではあるんだよな……