ドラゴンスピーチの最新版にビックリ!!

スタパ齋藤
1964年8月28日デビュー。中学生時代にマイコン野郎と化し、高校時代にコ ンピュータ野郎と化し、大学時代にコンピュータゲーム野郎となって道を誤る。特技は太股の肉離れや乱文乱筆や電池の液漏れと20時間以上の連続睡眠の自称 衝動買い技術者。収入のほとんどをカッコよいしサイバーだしナイスだしジョリーグッドなデバイスにつぎ込みつつライター稼業に勤しむ。


ドラゴンスピーチの最新版にビックリ!!

 スマートフォンやタブレット端末で、けっこー音声入力を使う最近の俺。そしてWindows 8発売ということで、Windowsマシンをタブレット的に使うシーンも増えてきそう……と思った途端、急激に音声認識ソフトの「ドラゴンスピーチ11J」が気になってきたので、試用してみた。

米ニュアンスコミュニケーションズの「ドラゴンスピーチ11J」。パソコンに声で文字入力したり、パソコンを声で操作したりできるソフトだ。写真右は [ヘッドセットマイク付]パッケージに付属するヘッドセット

 一部の(新しめの)iOS端末への音声入力や、Android端末での音声入力は、かなり実用的だと感じている。たとえばiOSだとメモアプリやメールアプリ使用時、ヘタするとソフトウェアキーボードを使うより声による文字入力のほうが効率いいかも、みたいなケースが多いと感じている。Android端末も同様、Google音声入力はちょいと便利だし、Google検索でのキーワード音声入力や、GooglePlayでのアプリ名の音声入力なんかはスゴく実用的ですな。

 で、Windows 8搭載マシン。タブレット的な使用を想定するマシンが比較的に多く登場している。のだが、iOS端末やAndroid端末のようにスムーズな音声入力がデキナイと、結局キーボードを使う必要が出てきちゃって、若干不便だったりする? とか思った。

 でも、Windows 8マシンはWindowsプラットフォームなので、既に音声認識ソフトは多々ある。そーゆーのを使えば、Windows 8をタブレット的に使ったとき、もしかして実用的な音声入力とかできちゃわない? と考えて「ドラゴンスピーチ11J」を使用してみたというわけだ。

 以降、ドラゴンスピーチ11Jの機能や使用感についてレポートしてみたいが、ココで結論だけ言っちゃうと、ビックリしましたマジで。凄い認識率。少々条件付きではあるが、いろいろな観点から実用的なのであった。

 

えっ? アレやんないの!?

 さて、早速ドラゴンスピーチ11Jをインストール。ソフトウェアをインストールして付属ヘッドセットをUSB接続し、ユーザーのプロファイルを登録すれば使えるようになる。

インストール後、使用前に、ユーザーがどういう設定(主にマイクやその音量などの設定)でドラゴンスピーチ11Jを使うかを、プロファイルとして登録する
マイク音量などは自動調節される。従来バージョンでは「声の登録作業(トレーニング)」が必須だったが、最新版では不要になった。ていうか声の登録ナシで、音声の認識率とか大丈夫なの……!?

 インストール~使用開始準備時、ちょっと驚いたのが「声の登録作業(トレーニング)」をスキップしてもいいということ。以前のバージョンでは必須だった過程であり、ソフトウェアにユーザーの声質やしゃべり方のクセを学習させる点で非常に重要なステップなのだが、ドラゴンスピーチ11Jではソレを省いてもOKとのこと。

 この「声の登録作業(トレーニング)」は、地味な感じの文章を数分程度読むというようなもので、若干面倒であった。これが無くていいのはラクですな。でもやっぱり、こういう重要なステップを省くと、音声認識率が下がったりするんだろうなぁ。

 とか思っていたが、音声入力した結果、かなりビックリ。音声の認識率が非常に高いのである。以下、動画でご覧いただきたい。

【動画】音声入力した様子。「はじめまして まる こんにちは まる けっこうにんしきりつたかいですね まる ていうかまちがえませんね まる」と話した

 あらまあ認識率高い~♪ 入力も速い気が!! 「まちがえませんね」を「間違いませんね」と認識したが、声の登録なしでここまでできるとは。凄い凄い。

 正直な話、この手のソフトにはあまり期待していなかったりした俺である。最後にWindows用音声入力ソフトを使ったのはいつだったか忘れたが、「多少は使えるけど、誤認識も少なくなくて、修正がけっこー面倒」という印象で、ここ数年は全然使っていなかった。

 また、今回ドラゴンスピーチ11Jを試用してみて、イマイチな感じだったらレポートはボツにしようと考えていた。既にiOSやAndroidで実用的な音声認識が使えるわけで、それ未満のパフォーマンスだったら記事にする意味が希薄ですしネ。

 ところが、ドラゴンスピーチ11J、たいへん優秀な感じ。テンション上がった!! いろいろ試してゆきたい!! みたいな心意気となった。そんな気持ちを音声入力してみた。

【動画】さらに音声入力。誤認識することもあるが、落ち着いてハッキリめに話せばだいたい認識してくれる

 ん~かなり実用的。もちろん、誤認識することもあるわけだが、しかし、「声の登録作業(トレーニング)」なしでこの認識率は大したモンである。「声の登録作業(トレーニング)」を行えば、もっと認識率が高くなるように思う。
 ともあれ、これならWindows 8タブレットで十分実用的な音声入力ができますな。原稿の下書きを声で入力できるレベルだと思う。

 

スマホ類をワイヤレスマイクとして使える

 試用したドラゴンスピーチ11Jは、専用(というかメーカー公認)のヘッドセットが付属したパッケージだ。ヘッドセットは軽く、耳への当たりもソフトで、使い勝手が良い。ただ、PCとUSB接続するため、ケーブルがちょっと邪魔なことがある。また、ヘッドセット付きパッケージはその分価格も高い。

 だが、ドラゴンスピーチ11Jは、iPhoneやiPad、それからAndroid端末を「Wi-Fi接続のワイヤレスマイク」として使えるのだ。ドラゴンスピーチ11JをインストールしたPCと、上記スマホが、同じLAN上にある必要があるが、手持ちのスマホがワイヤレスマイクとして使えるというのは便利な予感。試してみた。

 なお、この機能を利用する場合、スマホ側に「Dragon Remote Microphone」アプリをインストールする必要がある。iOS用はこちら、Android用はこちら

スマートフォン類を音声入力用マイクとして使う場合、新たなプロファイルが必要となる。プロファイル内の音声デバイスとして「Dragon Remote Microphone アプリケーション」を選択する
スマホ側では「Dragon Remote Microphone」アプリを使用。同じLAN内にあるドラゴンスピーチ11Jが動作中のPCをアプリから選ぶ程度で、設定は終了。ロゴにタッチして音声入力するが、ロゴが赤なら入力停止状態、緑なら入力可能状態となる

 以降は、ヘッドセットを使ったときと同様、スマホのマイクに向かって音声入力すればいい。スマホのマイク部と口の距離をなるべく等しく保つほうがいいようだが、全体的に認識率は良好。実用的だと感じられる。

 ほか、スマホやICレコーダーのボイスレコーダー機能を使って録音した音声ファイルを、ドラゴンスピーチ11Jに読み込んで文字化することもできる。たとえば、iPhone 5のボイスメモアプリで声を録音し、その音声ファイルをPCに転送、さらに音声ファイルをドラゴンスピーチ11Jで読める形式(DSS、DS2、MP3、WMA、WAVなど)に変換して、ドラゴンスピーチ11Jの「音声データを文字化する」メニューで読み込めばOK。実際に試したが、認識させる音声が明瞭であれば、認識率は良好なものとなった。

 

音声入力&音声制御

 ドラゴンスピーチ11Jはヒッジョーに多機能であり高機能な音声入力ソフトで、単に音声でテキスト入力できるだけでなく、音声でパソコンのUI(ユーザーインターフェース)操作もできる。そして、音声でのテキスト入力とUI操作を併用することも可能だ。

 たとえば、おもしろいところでは、ドラゴンスピーチ11Jを使ったtwitter(https://twitter.com/stapasaito)への投稿。手順もシンプルで実用的だ。

 具体的には、「ツイッターへ投稿」と言うと、twitter投稿用ダイアログが表示される。そうしたら文字通り「声でつぶやく」のだ。すると音声のつぶやきが即座にテキスト化される。次いで、「クリック オーケー」と言えば、ダイアログの[OK]ボタンが押下され、ツイート完了となる。

【動画】ドラゴンスピーチ11Jを使い、声だけでツイッターにツイートしている様子

 もうひとつ身近なところでは、Google検索やAmazonでの商品検索も声だけで行える。なお、ドラゴンスピーチ11Jから音声で直接利用できるウェブサービスは、twitterやGoogle検索やAmazon検索のほか、Facebook、Yahoo、MSN、Wikipedia、楽天、mixi、YouTube、ニコニコ動画、食べログ、価格ドットコム、OKWaveなど多数ある。

【動画】Google検索を使う場合は「グーグル検索 [キーワード]」と言えばいい。ブラウザが閉じた状態からでも、もちろんOK【動画】Amazonで商品検索をする場合も同様、「アマゾン検索 [商品名]」と言えば検索される

 大したモンですな~。認識率が高いからこそ、なんでしょうけど、声でコンピュータを操作する時代がフツーに来たって感じだ。

 UIの操作は、ボタンのクリックからメニュー選択からマウスポインタの移動やクリックまで、ほとんど何でもという感じで行える。また、音声入力に関しては、文字入力に対応するアプリやダイアログに対してならほぼ何に対しても音声による文字入力が可能。

 また、ドラゴンスピーチ11JはMicrosoft Officeアプリなどにもしっかり対応していて、たとえばOutlookを使って声だけでメールを書いて出せたり、Excelへの数値入力なんかも可能。数字専用の入力モードもあるので、かなり実用的な数字の音声入力ができたりする。

 また、独自の音声コマンドを作ることもできる。たとえば「私の住所」と言ったら自分の住所が入力されるとか、そういう「音声と入力語句の紐付け」も自由に行える。

 この記事で提示したいくつかの動画では、(人間に)聞き取りやすいようにややゆっくり喋っているが、実際はもっと速くても(ハッキリ喋れば)問題無く音声認識される。長いフレーズを音声コマンド登録し、早めに喋りつつ音声入力したりすると、キーボード入力を遙かに超える効率で文字入力できるようになるかもしれない。

 ドラゴンスピーチ11Jを使えば、PCの操作や入力をほぼ全部、声だけで行うことも可能ではある。が、たとえばマウスポインタの移動~クリックなどは、声で行うより、フツーにマウスで行ったほうが効率が良い。キーボードやマウスで行うと効率が良い作業と、ドラゴンスピーチ11Jの音声入力のほうが効率がよい作業を、うまく使い分けると、とてもシアワセになれるような気がした。

 ともあれ、「一応機能する」とか「使えないことはない」というレベルではなく、「十分実用レベルの音声入力ソフト」だと言えるドラゴンスピーチ11J。残念ながら体験版はナイそうだが、実用的な音声入力ソフトを探しているなら、ぜひ一度チェックしてみてほしい。

 

2012/10/29 06:00