ニュース

グーグル、次世代の音声入力「Rambler」発表 言いよどみや言い直しをAIが自動で整理

 グーグルは、キーボードアプリ「Gboard」に統合される新たな音声入力機能「Rambler」を発表した。生成AI「Gemini」の言語理解能力を活用し、人間の自然な話し言葉から不要な言葉を省き、要点を整理してテキスト化する機能を備える。

「No wait」と言い直した内容が入力される

「話し言葉」と「書き言葉」のギャップを解消

 グーグルは、既存の音声入力が高速かつ正確に機能する一方で、人間の自然な会話には「えーっと」といったフィラー(つなぎ言葉)や、発言中の言い直しが頻繁に含まれる点を指摘。

 Ramblerは、従来の「話した通りに入力される」仕組みから離れ、AIがユーザーの意図を汲み取って適切な書き言葉へと変換するために開発された。一言一句を正確に話すプレッシャーからユーザーを解放し、思いついたままに発声しても、AIが重要な部分だけを抽出して簡潔なメッセージを構成する。

Rambler

言い直しの自動反映とリアルタイムな書式調整

 デモでは、買い物リストを作成する音声入力が披露された。ユーザーがアボカドや卵などを挙げた後に「やっぱりバナナはやめて」と口頭で言い直すと、Ramblerは自動的にバナナを除外して文章を生成した。

 入力された言葉を単に認識するだけでなく、変更された思考のプロセスを把握し、意味が通るように情報を再構築する。

 また、生成されたテキストに対して「リスト形式にして、私らしい絵文字を追加して」と続けて口頭で指示を出せば、フォーマットやトーンを即座に微調整できる。

 Ramblerはメッセージアプリだけでなく、メールの作成、ドキュメントの編集、さらにはAIエージェントへのプロンプト入力など、Gboardを利用するあらゆる場面で機能する。

多言語の混在入力とプライバシーを確保したデータ処理

 Geminiが持つ高度な多言語モデルの恩恵により、ひとつのメッセージ内で複数の言語を切り替えて話した場合でも、AIが文脈やニュアンスを理解して正確にテキストとしてキャプチャする。たとえば、英語とヒンディー語などを交えて話しても、ユーザーの意図した通りに文章へと変換される。

 なお、RamblerはGboardの内部に組み込まれており、機能を使用している際は、その旨が画面上で明確に表示される。音声データの文字起こしはクラウド上で処理されるが、データは一時的に処理されたのち即座にデバイスへ返される仕組みとなっており、音声が保存や記憶されることはない。