ニュース

グーグルが「Nano Banana Pro」発表、文字入れ精度向上などGemini 3 Proベースの画像生成AI

 米グーグル(Google)は、最新の画像生成・編集AIモデル「Nano Banana Pro」を発表した。

 「Gemini 3 Pro」をベースに構築され、従来のモデルと比較してテキストの描画精度、複雑な指示の理解力、現実世界の知識に基づいた描写力が大幅に強化されている。一般ユーザー向けにはGeminiアプリ、開発者向けにはAPIなどを通じて提供を開始する。

 Nano Banana Proの最大の特徴は、Gemini 3 Proの高度な推論能力を活用し、単なる画像の生成にとどまらず、情報の可視化に特化している点だ。

 Google検索の基盤と連携することで、気象情報やスポーツの結果といったリアルタイムのデータを反映したインフォグラフィックや、レシピの手順図などを正確に作成できる。

 また、テキスト描画能力が向上し、画像内に配置される文字のスペルミスを低減。多言語に対応しており、画像内の看板や商品パッケージの文字だけを自然に翻訳・置換するといったローカライズ作業も可能となった。

 クリエイティブな制作現場での利用を想定し、構成の一貫性と編集機能も強化された。最大14枚の画像をリファレンスとして読み込み、それらを違和感なく1枚の画像に合成できるほか、最大5人の人物の顔や特徴の一貫性を維持したまま、異なるアングルやシーンで描写できる。

 編集機能では、被写体の位置を変えずに照明のみを「昼から夜」へ変更したり、被写界深度(ボケ味)を調整したりといった、スタジオ品質のコントロールを実現した。

 制作物の出力仕様についても、プロフェッショナル用途に対応する強化が図られた。生成画像の解像度は新たに2Kおよび4Kに対応し、ソーシャルメディア向けのデジタルコンテンツから高精細な印刷媒体まで、幅広い媒体での利用が可能となる。

 また、アスペクト比(縦横比)の変更も柔軟に行える。単に画像を切り取るのではなく、被写体のキャラクターや製品の位置を固定したまま、背景部分を拡張・縮小して比率を調整するといった高度な編集が可能だ。これにより、プラットフォームごとに異なる画像規格へ適応させる作業が効率化される。

Geminiアプリで利用可能

 一般ユーザーは、Geminiアプリで「画像を作成」を選択し、「Thinking」モデルを使用することでNano Banana Proを利用できる。

 無料ユーザーには一定の利用枠が設けられ、枠を超過すると従来の軽量モデル「Nano Banana(Gemini 2.5 Flash Image)」に切り替わる。

 Google AI Plus、Pro、Ultraのサブスクリプション契約者には、より多くの利用枠が付与される。

 企業・開発者向けには、Google AI StudioやGemini API、Vertex AIを通じて提供される。また、Google Workspace(Slides、Vids)やGoogle Adsの画像生成機能にも順次統合され、プレゼン資料作成や広告クリエイティブの制作効率化を支援する。

電子透かしも

 生成された画像の透明性を確保するため、すべての生成画像には電子透かし「SynthID」が埋め込まれる。

 さらに、無料ユーザーおよびGoogle AI Proユーザーが生成した画像には、視認可能な透かし(Geminiのキラキラアイコン)が表示される。

 一方で、プロフェッショナルな利用を想定し、Google AI Ultra契約者およびGoogle AI Studio経由で生成された画像については、この視認可能な透かしは削除される仕様となる。