ニュース

三笘選手のシュートフォームをグーグルのAI「Gemini」が教えてくれる、国立競技場で体験会

国立競技場Bゲート前にある特設ブース

 グーグルは、「AI Penalty Challenge with Google Pixel」と題したイベントを7月24日と28日、国立競技場で開催する。ペナルティキックの場面を模してシュートすると、AIがアドバイスしてくれる。

 イベントでは、特設ブースにサッカーボールを蹴るスペースが用意され、予約なしで、無料かつ誰でも参加できる。

取材のためということで、スタッフによるシュートも見せていただいた

 スタッフの案内に従って、ボールを蹴ると、そのフォームが撮影される。すると、AIによる解析で「パワー」「精度」「フォーム」という3項目と、総合値でスコアが付けられる。これは、サッカーの三笘薫選手のフォームをもとにしたもの。3回キックすると、スコアを振り返って、三笘選手の過去の発言などからアドバイスしてくれる。

 さらに、参加者のシュートフォームの写真と採点結果を記録した「Team Pixelカード」がプレゼントされる。カードのもう一面には、同イベント限定となるサイン入りの三笘選手の写真がデザインされている。

 場所は、国立競技場(東京都新宿区霞ヶ丘町10-1)のBゲート前。

Pixelでフォームを撮影して「3つのスコア」を算出

 イベント直前の今回、サッカー経験ゼロの筆者が現地のブースを訪れて、実際に採点してもらった。繰り返しになるが、ゴールに見立てた枠の左上と右上に四角い的が掲げられ、そこに向かってボールを蹴るだけ、というシンプルな内容だ。

Pixel Foldを見せてもらいながら説明を受ける

 このボールを蹴る場面、そして、記録されたフォームの写真がクラウドで解析されてスコアやアドバイスが生成されることになる。

 ボールを蹴る際には、スタッフの合図を待つ。この合図と同時に、ブース内に複数設置された、Pixelスマートフォンのカメラが参加者とボールを連写する。

ゴールの隅を狙って蹴る(スタッフの方に蹴ってもらった場面)

 ボールを蹴り終えるとPixelから、現地に仮設された光回線経由でGoogle Cloudに写真が送信される。つまり、Pixelはあくまでカメラだけ、センサーだけという役割を担っている。

 クラウドに送られた写真は、グーグルのAIのひとつ「AutoML Vision」で処理される。ボールにセンサーは内蔵されておらず、複数の写真からボールをトラッキングしてスピードを算出する。これが判定時には「パワー」としてスコアが示されることになる。

 さらに別の写真で、ゴール左右上部の的とボールの距離が導き出され、これが「精度」という項目でスコアが出る。

 参加者がボールを蹴る姿の写真からは、骨格が推定され、「フォーム」という項目で数字が示される。

サッカー経験ゼロ(子供のころの草サッカーのみ)だがキャプテン翼で育った筆者のスコア。100点満点中の99点ということらしい

三笘選手と比較してアドバイス

 スコアが出ると、「アドバイス」と「カードの作成」の2つの体験が残る。

 このうち「アドバイス」は、先述した通り、三笘選手の過去の発言と、三笘選手のフォームを参考にする。

 フォームを参考にする、ということで、参加者の蹴った姿と、あらかじめクラウド側に用意されている三笘選手のフォームが比較される。

 これは瞬時に終わり、同時に、グーグル側が作り込んだプロンプト(生成AIへの命令文、内容は非開示)が、グーグルのAI「Gemini」で実行される。このとき、参加者のフォームの写真や、参考にするデータとして「三笘の言葉」が用いられる。つまり「テキスト」「画像」を同時に扱える、マルチモーダルなGeminiの特徴を生かした仕組みだ。

Geminiで生成されたアドバイス

画像生成AIでカードを演出

 最後に残るは「カードの作成」。ここでは、画像生成AI「Imagen 2」が活用される。

 参加者がボールを蹴った瞬間の写真をもとに、「英雄的」「天使」などの選択肢を選ぶと写真が加工され、ドラマティックな演出を加えた写真にしてくれる。

画像を選び……
Imagen 2でエフェクトを付ける
かなりしっかりしたカードがもらえた
裏面には三笘選手の写真とサイン

低いコストで開発

 今回の体験イベントは、米国で開催されたグーグルのイベント「Google Cloud Next」で披露されたものをベースにしている。

 参加者が「ブースでボールを蹴るだけ」で、スコアを付け、三笘選手を目指すためのアドバイスをもらい、カードまで作ってくれる。これらの一連の流れは、参加者が待ち時間を意識する間もなくスピーディに進められており、テクノロジーのことを知らずとも楽しめるつくり。グーグルのAI技術とクラウドサービスが縁の下の力持ちとして、その体験を支えている。

一連の処理を示したもの

 グーグルの担当者によれば、生成AI(大規模言語モデル、LLM)が広がる前であれば、たとえばフォームを判定し、アドバイスを提供するためには、データサイエンティストがボールの軌跡や骨格・フォームをどう評価するか、1~3カ月といった時間をかけて仕込む必要があったという。

 今回、Geminiでアドバイスを生成する際のプロンプトは、相当な長文とのことだが、それでもデータサイエンスでの作り込みはなく、プロンプトで参加者のデータはこれ、三笘選手のデータはこれ、過去の発言から適切なものを選んで、というプロンプトだけで対処できるようになっており、はるかに低いコストで開発できた、とグーグル担当者は説明。幅広い人が生成AIによる新たな体験を味わえる機会となりそうだ。

開催要項

7月24日 11時~19時

7月28日 15時~20時

国立競技場(東京都新宿区霞ヶ丘町10-1)のBゲート前

予約不要、無料。整理券配布予定

雨天決行、大雨などの場合は中止になる可能性あり