ニュース

「Gemini 1.5 Pro」、180カ国以上でパブリックプレビューを開始

 Google(グーグル)は、同社の生成AI「Gemini 1.5 Pro」のパブリックプレビューを180カ国以上を対象に開始した。

 「Gemini 1.5 Pro」は、今年2月に「Google AI Studio」において初期テスト用で公開されたAIモデル。今回、同モデルが「Gemini API」を通して180以上の国と地域においてパブリックプレビューで利用可能となったことが明かされた。

 「Gemini 1.5 Pro」は対応言語の音声を理解する機能と、新たなファイルAPIを備える。音声理解機能については、「AI Studio」と「Gemini API」で利用可能。これにより、「Google AI Studio」にアップロードされた動画の画像と音声の両方を推論できるようになった。APIのサポートは近日中に追加される。

出力形式を設定できる新機能

 開発者の要望を踏まえたものとして「Google AI Studio」および「Gemini API」で、AIモデルの出力形式や目標などを設定できるようになった。これにより、ユーザーのユースケースに合わせた返答が誘導可能となる。

 また、JSONオブジェクトのみを出力し、文章や画像から構造化データを抽出する「JSONモード」の導入や「関数呼び出し」機能も改善された。

新たな埋め込みモデルの提供開始

 さらに、パフォーマンスを改善した埋め込みモデルの提供が開始された。Gemini API経由で利用でき、より高い検索性能を持つとしている。

 「Gemini 1.5 Pro」は「Google AI Studio」から利用できる。コードの例などは「Gemini API Cookbook」で確認できるほか、Discordのコミュニティチャンネルも開設されている。