ニュース

グーグル、推論機能とコード作成に優れる「Gemini 2.5 Pro」公開

 グーグル(Google)は、生成AI「Gemini」の新たなモデル「Gemini 2.5 Pro(experimental)」を提供開始した。

 「Google AI Studio」やGemini Advancedを契約しているユーザーが利用でき、「Vertex AI」でも近日中に利用可能となる。編集部で確認したところ、日本国内でもGemini Advancedユーザー向けに提供されている。

 「Gemini 2.5 Pro(experimental)」は、「Gemini 2.5」の最初のリリースで、推論機能とコード作成能力に優れるという。AIモデルのベンチマーク「LMArena」では他に大幅な差をつけて1位になった。

他のモデルとの比較

 グーグルでは、強化学習や思考連鎖の促進などを通じて、AIの推論能力をより賢くする方法を模索してきた。これを基にして「Gemini 2.0 Flash Thinking」が開発された。「Gemini 2.5」では、大幅に強化された基本モデルに加え、改善された事後学習(post-training)を組み合わせることで、パフォーマンスを高めている。

「Gemini 2.5 Pro」の紹介

 「Gemini 2.5 Pro(experimental)」は、複雑なタスク向けの最も高度なAIモデルで、一般的なコーディングや数学、科学のベンチマークでリードしており、GPQAやAIME 2025などのベンチマークによって、同モデルの強力な推論機能とコード作成能力が裏付けられるという。

各種ベンチマークテストの結果

 また、人間の知識と推論の限界を捉えるために何百人もの専門家が設計したデータセットである「Humanity's Last Exam」では、ツールを使わずにモデル全体で、他の生成AIモデルよりも優れる18.8%のスコアを記録した。

高度なコーディング機能

 「Gemini 2.5」は、「Gemini 2.0」から大きく進化しており、コードの変換や編集だけでなく、視覚的に魅力のあるWebアプリやエージェントアプリの開発に優れている。エージェントコード評価の業界標準である「SWE-bench Verified」では、カスタムエージェント設定で63.8%のスコアを記録した。

 Googleが公開したデモでは、プロンプトに「HTMLを使わずにp5.jsで魅力的なエンドレスランナーゲームを作って。主要な説明は画面上に表示、ピクセル化された恐竜とおもしろい背景がいいな」と入力すると、約1分少々でコードが生成され、実際にゲームが楽しめる。

【「Gemini 2.5」で簡単なプロンプトからゲームアプリを開発する例】

 「Gemini 2.5」は、テキスト、音声、画像など複数のデータを組み合わせたりするマルチモーダル性と、長いコンテキストウィンドウという「Gemini」モデルの優れた点をベースに、100万トークンのコンテキストウィンドウを取り扱いでき、これは近日中に200万トークンに拡大される予定。

ケータイ Watchをフォローして最新記事をチェック!