IJETの音声入力セッション

Project Tokyo 2010でのプレゼン内容がまだ途中になっていますが、6月2~3日に広島で開催されたIJET-23(第23回 日英・英日翻訳国際会議)に参加した際、音声入力に関するセッションがあったので、それについてここに書いておきます。IJET参加者による実況ツイートのTogetterまとめもあるので、量が多いですが興味のある方は読んでみてください。
セッションの内容
セッションのタイトルは「音声入力ソフト活用における2つの盲点」。プレゼン発表者は福光潤さんという特許翻訳者。日本での特許翻訳は和文特許の英訳の仕事が多く、福光さんも英日・日英両方の翻訳に携わっていて、両方に音声入力を利用しています。また、プライベートではシンガーソングライターとしても活動しているとのこと。音声入力の導入に際しては、作業効率向上への期待の他、シンガーらしく「声でどこまでできるのか?」という興味も動機となっていたというような話をされていました。
福光さんが使用しているソフトは英語入力にNuance社のDragon NationallySpeaking(日本での商品名は「ドラゴンスピーチ」) version 11、日本語入力についてはNuanceではもう開発を行っていないこともあり、アドバンスト・メディア社のAmiVoice SPを使っているとのこと。私はAmiVoiceの使用経験がないので、そのあたりの話に興味があってこのセッションに参加しました。
ドラゴンの日本語版と英語版を同時に立ち上げることはできないのですが、福光さんのデモによるとドラゴン英語版とアミボイスは同時に起動させることができるようで、両方とも開けておいて必要に応じて切り替えながら同じファイルに入力していくことも可能とのこと。これは便利そうです。
セッションでは実際にソフトを立ち上げて入力するデモがありました。ドラゴンによる英語入力とアミボイスでの日本語入力。これを見た参加者のほとんどは、音声入力は英語には使えるが日本語は全然ダメ、使い物にならない、という印象を受けたのではないでしょうか。また福光さんの話も「それほど効率化にはつながらないが、技術的な興味から使っている」というような内容で、その印象を裏付けることになってしまっていたのがちょっと残念でした。
タイトルの「2つの盲点」とは、

  • ソフトに学習させる過程が必要なので、音声入力自体が目的になってしまう
  • 修正に集中力を注ぎ込むことになってしまう

という点だそう。個人的にはちょっとピンとこなかったのですが…。
その盲点に関しての福光さんのアドバイス(経験談)は、

  • 誤認識はつきものと割り切る。
  • 誤認識が出る都度修正するのではなく、数ページくらい一気にボイスレコーダーに録音して音声ファイルを作り、それを読み込ませてからまとめて修正をかける。

とのこと。後で参加者から「まとめて吹き込み方式は自分にはとても無理だから使えそうにない」という感想をちらほらと聞きました。
次回に続きます。)