ニュース

パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現

島田純

2024年5月15日 07:52

　グーグルは、デスクトップ向けの「Chrome」のバージョン126に、「Gemini Nano」を組み込みする。主に、AIを使って閲覧中のWebサイトの翻訳や、要約などが行いやすくなる。

「Chrome 126」に「Gemini Nano」を組み込み

　グーグルが公開したデモでは、ブログサービス「アメーバブログ」の記事作成画面で作成した記事に「タイトルを生成する（Generate blog title）」ボタンが追加され、記事のタイトルが生成AIによって自動生成されている。

AIによって生成されたタイトルの候補

候補から選んでタイトルを決定

オンデバイスAIのメリット

　サーバサイドで実行される生成AIは、大規模なモデルにおいては最適な選択肢だが、オンデバイスやハイブリッド式にもそれぞれメリットがある。

　たとえば、生成AIは最小のモデルでも、平均的なWebページの1000倍ほどの大きさがあり、なおかつWebサイト間でモデルを共有できないため、ページロード毎にダウンロードすることは非現実的と言える。

　一方で、ローカルで実行できる「Gemini Nano」を使うと、WebサイトやWebアプリケーションが、独自のAIモデルを展開または管理せずに、生成AIを利用したタスクを実行できるようになる。

　Chromeに組み込みされる「Gemini Nano」には、基本モデルとエキスパートモデルがあり、エキスパートモデルは特定の用途にあわせて、より高いパフォーマンスと品質を実現する。たとえば、翻訳APIはコンテンツの翻訳に特化したエキスパートモデルであり、エキスパートモデルはハードウェアの必要要件が低く抑えられる傾向がある。

　ビルトイン式のAIモデルでは、Webブラウザ（Chrome）がモデルを配信するにあたり、デバイスのスペックを考慮し、モデルの更新を管理するため、オンデバイスAIと比較して導入が容易という。

　このほか、ビルトイン式のAIモデルでは、機密データーをローカルで処理でき、プライバシー面でのリスクが低い。また、インターネット回線が使えない状態でもAIが利用でき、通信待ち時間が短縮され、快適なユーザー体験が得られるという。

　これに対して、ハイブリッド式またはサーバーサイドでのAI利用は、より大きなモデルを使ったり、広範囲のプラットフォームやデバイスで生成AIを利用する場合に利便性が高い。