ニュース

グーグル、Google I/O 2026で新たなAIモデル「Gemini Omni」を発表

佐藤文彦

2026年5月20日 03:12

　20日（日本時間）、Google I/O 2026でGoogle DeepMindのデミス・ハサビス氏から、新たなAIモデル「Gemini Omni」が発表された。人工汎用知能（AGI）の実現に向けた重要なステップとされる。

　Gemini Omniは、Geminiが持つ高度なインテリジェンスと、最高峰の生成メディアモデルを融合させた新モデルとされる。最大の特徴は、「どのような入力からでも、あらゆるものを作成できる」点だ。

　AIが単にテキストを予測する段階から、現実世界を理解しシミュレートする「世界モデル（world model）」への進化を体現しており、これまでにないレベルの世界理解、マルチモダリティ、および編集機能を備えている。

　Gemini Omniの能力は、複雑なアイデアを非常に正確な動画に変換できる点に表れる。例えば、「タンパク質の折り畳み構造についてのクレイアニメ解説動画を作って」というシンプルなプロンプトを提示するだけで、的確な動画を出力することが可能となる。

　さらに、最初の生成だけでなく、対話的な自然言語を用いてより直感的な方法で動画を編集できる点も大きな特徴。ユーザー自身が用意した動画（自撮り動画など）を入力し、細部やスタイルを調整したり、新たな要素を追加したりすることができる。単純な円をブラックホールに変えるなど、シーン全体を新しいアイデアを反映したものに変更し、全く新しい現実を創り出すキャンバスとして機能する。

　Gemini Omniの取り組みは動画領域から始まったが、長期的には「あらゆる入力からあらゆる出力を生成する」という、Geminiを当初からマルチモーダルとして構築した、本来の目標を実現していく予定である。

　今回のGoogle I/Oでは、Omniファミリーの最初のモデルとなる「Gemini Omni Flash」のローンチが発表され、すでに各種プロダクト全体で利用可能となっている。また、今後「Omni Pro」についても詳細が共有される予定となっている。