ニュース

「Gemini」の画像編集が強化、人物の一貫性を維持

2025年8月27日 17:45

　グーグルは、Google DeepMind製の新しい画像編集モデルがGeminiアプリに統合されたと発表した。

　画像の生成や編集を繰り返してもキャラクターの一貫性を維持することに重点をおいて改善に取り組んできたといい、人やペットの写真を編集する際に、わずかな編集をおこなう場合でも常に本人らしく見えるように設計されているとうたう。

　ユーザーはGeminiに写真を渡し、変更したい内容を伝えるだけで編集を行うことができる。写真を組み合わせて自分をペットと一緒に写したり、新しい壁紙を部屋にあわせて下見したり、世界中の風景に自分を配置したりでき、その過程で自分らしさが保たれるという。

　編集後には、画像をGeminiにアップロードして動画に変換することもできるとする。

主な機能

　ユーザーがアップロードした人物やペットの外見的特徴を保ったまま、背景や服装を自由に変更可能。これにより、自分自身を様々な衣装や職業の姿にしたり、10年後の姿をシミュレーションしたりできる。

　複数の写真を合成し、新たなシーンを作成可能。自身の写真と愛犬の写真を合成し、バスケットボールコートで一緒に写る写真を作成することができる。

　チャットで指示を重ねることで段階的に編集を進められる。たとえば、「壁をサーモンピンクに塗って」「本棚を追加して」「家具を置いて」といった対話を通じて、イメージを少しずつ具体化していくことができる。作業を続ける過程で、Geminiは特定の部分だけを変更しながら、残りの部分はそのまま残すという。

　ある画像の質感や模様を、別の物体に適用する機能も加わった。「蝶の羽の模様でドレスをデザインして」と指示したり、花びらの色や質感を長靴に反映させたり、現実にはないデザインを生み出すことができる。

　なお、AIによって生成された画像であることを明確に示すため、Geminiアプリで作成・編集されたすべての画像には目に見える透かしと、目に見えない「SynthID」デジタル透かしが挿入される。