ニュース
パソコン向けChromeに生成AI「Gemini Nano」を搭載、翻訳や要約をオンデバイスで実現
2024年5月15日 07:52
グーグルは、デスクトップ向けの「Chrome」のバージョン126に、「Gemini Nano」を組み込みする。主に、AIを使って閲覧中のWebサイトの翻訳や、要約などが行いやすくなる。
グーグルが公開したデモでは、ブログサービス「アメーバブログ」の記事作成画面で作成した記事に「タイトルを生成する(Generate blog title)」ボタンが追加され、記事のタイトルが生成AIによって自動生成されている。
オンデバイスAIのメリット
サーバサイドで実行される生成AIは、大規模なモデルにおいては最適な選択肢だが、オンデバイスやハイブリッド式にもそれぞれメリットがある。
たとえば、生成AIは最小のモデルでも、平均的なWebページの1000倍ほどの大きさがあり、なおかつWebサイト間でモデルを共有できないため、ページロード毎にダウンロードすることは非現実的と言える。
一方で、ローカルで実行できる「Gemini Nano」を使うと、WebサイトやWebアプリケーションが、独自のAIモデルを展開または管理せずに、生成AIを利用したタスクを実行できるようになる。
Chromeに組み込みされる「Gemini Nano」には、基本モデルとエキスパートモデルがあり、エキスパートモデルは特定の用途にあわせて、より高いパフォーマンスと品質を実現する。たとえば、翻訳APIはコンテンツの翻訳に特化したエキスパートモデルであり、エキスパートモデルはハードウェアの必要要件が低く抑えられる傾向がある。
ビルトイン式のAIモデルでは、Webブラウザ(Chrome)がモデルを配信するにあたり、デバイスのスペックを考慮し、モデルの更新を管理するため、オンデバイスAIと比較して導入が容易という。
このほか、ビルトイン式のAIモデルでは、機密データーをローカルで処理でき、プライバシー面でのリスクが低い。また、インターネット回線が使えない状態でもAIが利用でき、通信待ち時間が短縮され、快適なユーザー体験が得られるという。
これに対して、ハイブリッド式またはサーバーサイドでのAI利用は、より大きなモデルを使ったり、広範囲のプラットフォームやデバイスで生成AIを利用する場合に利便性が高い。