ニュース
グーグル、スマホでAIと自然な会話ができる「Gemini Live」提供開始、まずは英語版で
2024年8月14日 03:21
グーグル(Google)は、生成AI「Gemini」を活用した「Gemini Live」の提供を開始した。英語で「Gemini Advanced」を使うユーザーが対象で、今後数週間以内に他のAndroidメーカーのデバイスやiOS(iPhone)、他言語にも対応を拡大する予定という。
「Gemini Live」は、生成AIの「Gemini」と会話形式でやりとりできるサービス。音声は10種類から好みの音声を選べる。
Googleが公開した「Gemini Live」のデモでは、「サプライズパーティの会場がどこか、Gmailを確認して」と話しかけると、Gmailでの履歴に基づいて会場の住所と時間について返答した。さらに所用時間について追加で質問すると、「Gemini」がGoogle Mapと連携のうえ、所用時間と目的地までのルートを表示している。
生成AIの「Gemini」は、全てのGoogleのアプリやツールに連携可能となる。今後数週間以内に、Google Keep、Task、Utilities、YouTube Musicなどの新たな拡張機能がリリースされる。例えば、ディナーパーティーの主催にあたって、友人がGmailに送ってくれたレシピを基にした材料をGoogle Keepの買い物リストに追加したり、相手と過ごした時代にあわせて90年代後半のプレイリスト作成を頼んだりできる。
間もなくリリースされるカレンダー拡張機能では、コンサートのチラシを撮影して「スケジュールが空いている日は?」と尋ねたり、チケットを購入するリマインダーを設定したりできるようになるという。
Androidスマートフォンでより深い連携
Androidでの「Gemini」は、電源ボタンの長押しまたは「Hey, Google」と話しかけるだけですぐに利用できる。「この画面について質問する」をタップすると、画面に表示されている内容について教えてくれたり、YouTubeを観ている場合は、今観ている動画に関連する質問ができる。例えば、海外旅行の準備のための旅行記を観たあとに、動画で紹介される全てのレストランをリストアップし、それらをGoogle Mapに追加するように依頼できる。
さらに、Androidスマートフォンでは、「Gemini」が生成した画像をGmailやGoogleメッセージなどのアプリの直接ドラッグ&ドロップし、友人や知人に送信できる。
「Gemini 1.5 Flash」
人間が扱う自然言語をより適切に解釈し、複雑なタスクを処理できる大規模な言語モデルを使うと、単純なタスクの完了にも時間がかかってしまうことが増える課題がある。また、生成AIは幅広いタスクをこなせるが、予期せぬ動作をしたり、不正確な情報を提供したりすることもある。
こうした課題に対処するために、Googleはより高速かつ高品質な応答をするモデル「Gemini 1.5 Flash」を組み込んだ。今後数カ月以内に、Google Home、電話、メッセージとより緊密に連携する予定という。