ニュース
グーグルのAI「Gemini Live」の会話がより自然に、話す速度の調整やアクセントの指定
2025年11月13日 12:53
グーグル(Google)は、同社のAIサービス「Gemini」のライブ会話機能「Gemini Live」の新機能を発表した。人間の話し方のニュアンスをより深く理解し、表現力豊かな会話が可能になるという。
アップデートにより、ユーザーは会話の速度をより細かく制御できるようになった。たとえば、学生がビジネス分析のような複雑なトピックについて説明を求めた後、「スピードを上げて」と指示すれば、Geminiは話す速度を上げる。アクセシビリティの向上にもつながる。
また、言語学習にも活用できる。韓国語で10の倍数についてクイズを出させたり、スペイン語でカジュアルな挨拶を練習したりするなど、特定のニーズに合わせて練習できる。
このほか、就職の面接や難しい会話の準備など、特定の状況を想定した練習相手としても機能する。
エンターテイメント面では、物語の読み聞かせ機能が強化された。たとえば、ユリウス・カエサルの視点でローマ帝国について語らせるなど、豊かな抑揚やキャラクターのアクセントを交えた没入感のある体験が可能になる。
さらに、カウボーイのアクセントや、コックニー(ロンドン訛り)のブリティッシュアクセントなど、楽しいアクセントを指定して会話を盛り上げることもできる。
GeminiアプリのプロダクトマネジメントディレクターであるAngela Sun氏による公式ブログでは、会話する際には、言葉だけでなく「声の抑揚、文のリズム、言葉の背後にあるトーン」といったニュアンスが重要と説明。Geminiとの会話も同様に自然で直感的であることを目指しているという。Gemini Liveで用いられる新しいモデルは、人間の音声の主要な要素を理解し使用する能力が劇的に向上したとしている。
