みんなのケータイ

リアルタイム文字起こしをパソコンで効率化!

 高速かつ高精度に日本語会話の文字起こしをしてくれる「UDトーク」。スマートフォンのマイクで拾った音声をテキストに変換してくれるというこのアプリを、仕事でしばらく活用している。

「UDトーク」でパソコンでの文字起こしが超快適になる……かも

 ところが、いかに高精度とはいえ誤認識はそれなりに発生してしまうものだ。スマートフォンを手で持って、マイクの近くではっきり発音すればほとんどその通りに変換されるけれど、会議やインタビューのときのように、スマートフォンをテーブルに置くしかないような状況だと、どうしても正しく認識されにくい。

 単にスマートフォンを置きっぱなしにしていて、後で変換されたテキストを見てみると、「なんじゃこりゃあ!(手に血)」みたいな内容になっていることが多々ある。というかほとんどそうだ。

 これは、指向性のある外部マイクを使うことで劇的に改善できそうな気がするのだけれども、UDトークで使えるとされているBluetoothマイクとなると1万円を超えるわりと立派なものしか見つからない。それで本当に精度が上がることにも確信がもてないので、今のところは投資を渋っている。

 せめて変換中に少しでも手作業で修正していければ……と思って、改めてUDトークのWebを見てみると、どうやら以前からパソコン版のコンパニオンアプリが用意されていた様子。これを使うことで望んでいたことができそうだ。

 このアプリケーションは、パソコンでUDトークと同じ音声認識機能を使えるもの……というわけではない。UDトークのスマートフォンアプリと連携して、スマートフォン側で変換したテキストをパソコン側に送り、パソコン側でそのセンテンスを修正するとスマートフォン側にも反映する修正支援アプリのようなものだ。

 利用するには、パソコンとスマートフォンを同じネットワークに接続した状態で両方のアプリを起動し、双方のアプリ上から互いに接続操作を行う。あとは、スマートフォンのマイクが音声を拾うと、その内容がパソコンアプリケーション上にも表示されるようになる。5分以上の連続使用は、あらかじめスマートフォンアプリの方で「アドオンの購入」(課金)をしておく必要があるので注意したい。

同じネットワークに接続した状態で、パソコンアプリケーションの左上に表示される接続先候補(スマートフォン)にダブルクリックで接続
スマートフォンアプリ側では画面上部に表示される接続先候補(パソコン)をタップ。すぐに音声認識画面へ移る

 音声を認識し始めると、パソコン上で数センテンスごとに変換テキストが自動で確定していくので、誤りがあればその場で修正していく。文字入力とEnterキーで新しいセンテンスに移動しながら誤っている箇所だけをどんどん修正していけるから、しゃべっている内容全部をキーボードでそっくりリアルタイムに文字起こししていくのに比べて負担は20分の1くらいになっている気がする。

 もちろん、しゃべり方や音声を拾っている位置によって変換テキストの精度は大きく変わってくるので、瞬時に修正可能な範囲で実用的なテキストになるかどうかはケースバイケース。なのだけれど、条件が整えばこれほど楽なテキスト起こしはないと言ってもいい。まあ、それでもやっぱり指向性のある外部マイクを試してみたいな、というのはある。

 ちなみに、外出中に接続先となるWi-Fiネットワークがないときが問題だが、そのときは別のスマートフォンでテザリングを有効にし、そこにUDトークを実行しているスマートフォンとパソコンを接続すればOK。試した限りでは、スマートフォン1台でUDトークの実行とテザリングを兼ねる形だと利用できなかったので、スマートフォンが2台(もしくはモバイルルーターが別に)あるのが前提となってしまうのがネックだろうか。