ニュース

グーグル、発話障害ユーザーの音声認識研究を日本語など全5言語に拡大

 グーグル(Google)は、発話障害をもつユーザーが音声認識を利用しやすくなることを目指す研究「Project Euphonia(プロジェクト ユーフォニア)」について、5月19日から日本語を含む5カ国語に研究活動を拡大したことを発表した。

 これまでの英語(2019年開始)に加え、日本語、フランス語、ヒンディー語、スペイン語に拡大された。

 これまで音声アシスタントは、発話障害を持つユーザーの言葉を理解できなかった。これは、音声認識技術が発話障害を持つ人々の十分かつ多様な音声サンプルセットでトレーニングされていなかったためだという。

 グーグルでは、ボランティアから提供された1600時間以上の音声サンプルにより、非常に広範な発話障害者音声データセットを作成し、3年前から研究を続けてきたという。

 作成した音声データセットは、GoogleのSpeechとResearchチームによる音声認識における差先端の機械学習研究に利用されている。たとえば、個々人の発声を理解するパーソナライズモデルの作成機能や、ユーザーの発話を明瞭な合成音声で言い直す音声認識機能の開発に活かされているという。

 また、発話障害ユーザーのコミュニケーションを支援する「Project Relate」アプリの開発にも利用されている。現在英語のみのベータ版で提供されているアプリでは、パーソナライズモデルが利用できるという。

 グーグルでは、英語の研究成果に続き、今回追加された日本語、フランス語、ヒンディー語、スペイン語をはじめとするほかの言語でも同様の取り組みを実施し進歩を遂げたいとしている。

 なお「Project Euphonia」については、英語での研究を通じて、音声認識モデルをトレーニングする音声サンプルが多いほど、より多くのユーザーを理解できるようになることがわかっているという。

 グーグルは、スマートフォンなどの音声認識が思ったように反応しなかったり、相手に言いたいことが伝わらなかったりする経験を持つユーザーに、「Project Euphonia」に参加してほしいと呼びかけている。