ニュアンス、音声認識対応スマートフォンアプリ開発ツール発表


AARON MASIH氏

 ニュアンスコミュニケーションズジャパンは、音声認識技術を使ってモバイル機器や自社サービスなどに対して、音声入力機能や音声検索機能、音声読み上げ機能といったモバイル向けの音声関連機能が盛り込める開発ツール「Dragon モバイル SDK」を発表した。

 ニュアンスコミュニケーションズは、文字予測変換入力ソフト「T9」や、音声や画像の認識ソリューションを保有する米国企業。同社の音声認識技術は、コンタクトセンターなどの法人向けソリューションや、カーナビ、ゲームソフト、携帯機器、電子辞書などで採用されており、最近では、音声で文書作成できる「Dragon Dictation」や、音声で検索できる「Dragon Search」といったiPhoneアプリを提供している。いずれのアプリも無料で利用可能だ。

 ニュアンスでは、2月4日、モバイル向けの音声認識技術を開発会社に提供するため、「ニュアンス・モバイル・デベロッパー・プログラム(NMDP)」を開始すると発表した。このプログラムでは、スマートフォンのアプリケーション開発者に向けて、モバイル向け開発ツールである「Dragon モバイル SDK」が提供される。導入する企業は、自社サービスなどと連携させる形でスマートフォン向けの音声入力機能や音声検索機能、音声合成機能が導入できる。


iPhoneアプリ「Dragon Dictation」音声入力画面

 クラウドサービスと連携し、音声認識された語彙はサーバー側に匿名で蓄積・学習され、たくさんのユーザーに使われるほど、認識精度が高まっていく。また、音声認識の精度だけでなく、話し方のデータも学習されていく。この場合も匿名の端末固有のデータとしてサーバーに記録される。ニュアンスでは、セキュリティリスクを避け、かつユーザーにリスクがあることを感じさせないためにも匿名データのみ収集する形をとっている。

 iPhoneやAndroid向けのアプリが開発可能で、英語や日本語だけでなく、スペイン語やフランス語、ドイツ語、イタリア語など12の言語に対応している。導入する企業は90日間の試用が可能で、試用期間を経てから正式導入するかどうか決定できる。ライセンス費用を支払うのではなく、利用者数によって数段階の価格が用意されている。

 「Dragon モバイル SDK」は現在、世界で1200の開発企業において採用実績がある。米ニュアンスコミュニケーションズのモバイル部門のグローバル・ビジネス・デベロップメント・ディレクターのAARON MASIH氏は、ニュアンスのモバイル向け音声認識技術について、処理速度の小さなモバイル機器においても、クラウドサービスと連携させることで精度の高い認識が可能であるとしている。同社では、海外での実績が示す通り、日本においても携帯電話や自動車、医療、エンタープライズ用途とさまざまな展開が可能としている。


入力結果。「。」は「マル」、「、」は「テン」と発音する。入力結果はソフトキーで修正できる

 なお、米T-mobileのHTC製Androidスマートフォン「myTouch 4G」においては、端末のハードウェアキーとして「Genius Button」というボタンが用意されている。音声による機能の呼び出しやWeb検索、メッセージ作成・送信などが可能で、この音声認識技術はニュアンスが供給している。

 また、スマートフォンに通知されたメッセージを読み上げ、メッセージに返信できるソリューションなども提供されている。AARON MASIH氏は、「運転中にハンドルから手を離すことなく、ドライブに集中したままメッセージのやりとりができる」とアピールしており、フォードやアウディなどの自動車や、PNDでも音声認識技術が採用されているとした。日本語対応のSDKが提供されることで、国内向け製品でも音声認識技術が導入しやすくなるという。

 その一方で、音声認識技術にはライバル企業の存在も気になるところだ。国内ではアドバンスト・メディアが日本語音声認識システム「AmiVoice」を提供しており、最近では、米GoogleもAndroidやiPhone向けアプリなどで音声検索や音声認識による翻訳サービスを積極的に展開している。

 AARON MASIH氏は、「我々の言語モデルはフルカスタマイズが可能であり、ある企業が導入する場合、たとえば特定の用語であるとか、特定のフレーズを入れて認識レベルを高めることが可能。また、T-mobileのAndroid端末のように、初期状態でGoogleの音声検索サービスが付いていたとしても、Genius Buttonが搭載されている。我々の音声認識技術を実装することで、我々には言語認識について長い歴史があり、たとえ少しコストがかかっても、より適合性の高い音声認識が提供できる」と話しており、カスタマイズ性と音声認識精度が音声認識技術における差別化要因とした。ニュアンスでは、アジア・太平洋地域において、端末へのOEM展開のほか、SDKの提供によって、ホームエンターテイメント分野などへも音声認識技術の裾野を広げていきたい考えだ。

検索結果Wikipedia
YouTube楽曲検索

 



(津田 啓夢)

2011/2/10 15:44