ニュース

マイクロソフト、日本語のリアルタイム音声翻訳機能~Skypeや会議のライブ翻訳も

会議のライブ翻訳

 マイクロソフトは、翻訳サービス「Microsoft Translator」にて、日本語音声のライブ翻訳機能の提供を開始した。「Microsoft Translator」アプリやパソコン版Skypeなどで、無料で利用できる。

 新機能は、日本語による音声認識・音声出力とテキスト翻訳を組み合わせたもの。日本語で話した内容を、数秒で外国語の音声に変換できる。英語、スペイン語、中国語など9言語に対しては、相互に音声翻訳でき、リアルタイムの対話が可能。音声出力だけでなく、翻訳結果をテキストで表示できる。例えば、旅行先で観光ガイドが英語で話した内容を、日本語で表示するといった使い方もできる。

【「Microsoft Translator」のライブ翻訳機能】

 「Microsoft Translator」のWeb/アプリ版のほか、マイクロソフト製品に組み込む形でも提供される。Skypeでは、通話中のライブ翻訳サービスとして利用できる。他のSkypeユーザーとの音声通話やSkypeOut機能を使った通話中に、画面上に翻訳された言葉を表示する。

Skype通話でのライブ翻訳利用例

 PowerPointでは、プレゼンテーション用の翻訳アドインを提供する。登壇者がプレゼンテーションで話した内容が翻訳され、聴講者のスマートフォン上の「Microsoft Translator」アプリから閲覧できる。質問項目を日本語で入力して、登壇者の言語に翻訳して表示することもできる。

 その他、Microsoft EdgeやOutlookに翻訳機能が提供されている。また、APIとしても提供され、外部サービスに翻訳機能を組み込むこともできる。

Outlookでの利用例

「Microsoft Translator」はニューラルネットワーク活用で高精度に

マイクロソフト AI & Research グループ ディレクター オリヴィエ・フォンタナ氏

 提供開始に先立ち、米マイクロソフトの機械翻訳製品を統括するAI & Research グループ ディレクターのオリヴィエ・フォンタナ氏が来日。報道関係者向けに新機能を紹介した。

 日本語の音声翻訳機能の提供開始にあわせ、「Microsoft Translator」ではニューラルネットワークを活用したAIベースの機械翻訳システムを全面的に採用する。これにより、これまでの統計的手法による機械翻訳システムと比較して、より多様な「機械的ではない」表現が可能だという。

 また、マイクロソフトの音声翻訳システムは、音声認識によって一度テキスト化した文章を他言語に翻訳するといったように、2つのシステムが連携して動作する方式。その際、話し言葉をそのまま翻訳するのではなく、テキスト化した後、話し言葉に含まれる「あー」や「えーと」といった“つなぎ言葉”を削除するなど、翻訳に適すように整形を施す。これにより、より自然な形の翻訳となるとする。

 また、Microsoft Translatorの音声認識技術では、話し出すと自動的に認識を開始する。これが「思わぬ結果を生んだ」として、フォンタナ氏は同僚の聴覚障害者Ted氏の事例を紹介。健常者が話す内容を、スマートフォンで「読める」ようになり、より自然な形でコミュニケーションを取ることができるようになったという。

 「Microsoft Translator」の無料サービスでは、ユーザーが入力した情報の10%程度をサンプリングし、サービス改善に利用している。フォンタナ氏は今後、大量のデータを蓄積することで、翻訳精度を改善させていくとした。