インタビュー

「スマホで生成AI」で何ができる? クアルコムが最新チップセット「Snapdragon 8 Gen 3」の進化をキーパーソンに聞く

 クアルコムが開催したイベント「Snapdragon Summit」では、生成AIへ注力する方針が強く打ち出された。

 同時に発表されたスマートフォン向けの最新チップセット「Snapdragon 8 Gen 3」でも数多くの生成AI関連機能が含まれている。

 これまで、生成AIは高い処理能力を誇るクラウドコンピューティングで動作している。しかし、クアルコムが打ち出す方向はスマートフォン上、つまりオンデバイスで生成AIを動かすというものだ。

 披露された新機能のひとつは、画像生成AIである「Stable Diffusion(ステーブル ディフュージョン)をスマートフォン上で動作させるというもの。生成したい画像をテキストで入力する、いわゆるプロンプトを入れれば画像が生成される。パワーアップしたSnapdragonにより、その生成までの速度は1秒を切る。実際に試してみたところ、確かに1秒程度で画像が生成される様子がデモンストレーションで示された。

 また、独自のAIアシスタントもオンデバイスAIのウリのひとつ。クラウドに個人的な情報を渡さず、手元のスマートフォン内だけに年齢や好み、住む地域などの情報を留めておき、プライバシーを守りながら、AIがユーザーにマッチした情報を回答できるようにする。

 こうした処理は、Open AIが提供する音声認識モデルの「Whisper」、Metaが提供する大規模言語処理の「Llama(ラマ) 2」など複数のAIモデルが「Snapdragon 8 Gen 3」で動作して実現されることになる。

アスガー氏

 今回、クアルコムの製品管理担当シニアバイスプレジデントであるジアド・アスガー(Ziad Asghar)氏が日本メディアのグループインタビューに応え、どういった取り組みを進めたのか語った。

――「Snapdragon 8 Gen 3」のCPUコアの構成について、どのような考えがあるのか教えてください。

高負荷な処理を担うプライマリーコアが1つ、中間的な役割のパフォーマンスコアが5つ、処理能力を抑えたエフィシェンシーコアが2つ

アスガー氏
 クアルコムでは、実際のユースケースを調査して実態に即そうとしています。プライムコアを1つ搭載していますが、これは、より大きなスレッドがスマートフォンで実行されているということが背景にあります。

 OEMパートナー(スマートフォンメーカー)と話をする中で、彼らはゲーム用途に向けて、こうした高い処理能力を求めているのです。ゲーミングドライバーの書き方によって、もっと大きなスレッドが必要になるでしょう。

 そして、CPUコアのうち3つを1つの周波数で動作させている。2つのコアは、より低い周波数で動作するようにしています。

 こうなると、もっと低い消費電力で動作するコアがいくつかあればいいのでは、と思われるかもしれません。バックグラウンドで動作する基本的なタスクを処理するために4つのスレッドがとても低い消費電力で稼働できます。

 (重い処理となる)ピークのときには、周波数の異なるコアの組み合わせにより、必要に応じて素晴らしいパフォーマンスを発揮します。より低い負荷でいい場合は、最も低い能力ながら、非常に優れたパワーを発揮します。このようにメリットがある構成です。

 基本的にコアの構成の選び方には非常に慎重で、OEMとよくコミュニケーションを取っています。6つの大きなスレッドを管理でき、あらゆるケースで適切に消費電力と処理能力のバランスを取れます。

――GPUの進化についても教えてください。

アスガー氏
 GPUは、今回、よいリフレッシュを実施できました。ベンチマークアプリでは、前年から性能が25%、消費電力(の削減)も25%向上しています。革命的な大きな変化ではないけれど、GPUエンジンをかなりアップグレードしているのです。

 これはハードウェアをベースとしたレイトレーシングのアクセラレーションであり、跳ね返った面からの色や光、すべてを実際に取り込むことができ、そして、その滲み出た色をどんなサービスにも実際に変換することができます。これはかなり重要な機能です。8Kディスプレイに描画することもできます。フレームレートも240fpsまで対応しています。

 GPUコアの「Adreno(アドレーノ)」は、クアルコム自身が保有する技術です。ほかのベンダーからライセンスを受けているわけではない。

 Adrenoの特徴のひとつは、ワットあたりの性能です。ほかの技術よりも優れています。

 性能の面では、今年は革命的な変化ではありません。でも、クアルコムはパフォーマンスとパワー(処理能力)の両面でバランスを取ろうとしています。

 私たちの製品のパフォーマンスはiOSと比較してほしいです。「Snapdragon 8 Gen 2」の段階で新しいiPhoneに勝っています。

 もっとも大切なことは、その性能を使いこなすこと。それが本当のアドバンテージです。大規模な改善ではないが、他の誰よりもはるかに進んでいます。

――ソフトウェア面でのアップデートは?

アスガー氏
 グローバルイルミネーション(光を再現して描画する際、物に当たって反射したり拡散したりする様子を含めた照明効果)のようなものを同時かつ徐々に増加させて使えるようにするには、多くのドライバーソフトで作業が必要です。

 利点のいくつかは、コンパイラ(プログラムをコンピューター側に解釈できるかたちに変換するソフト)の改良を続けているおかげで実現できている。目に見えない改良もありますが、これはバックグラウンドで行っている作業です。

 レイトレーシング(光を再現して描画すること)や、当社のゲーム向け超解像技術(GSR、Snapdragon Game Super Resolution)を実現するには、そういった取り組みが必要です。

 クアルコムが提供するコンパイラには自信があります。グラフィックソフトウェアとして、おそらく世界中のどの会社よりも最高のチームです。そのこと自体が大きな違いでしょうし、だからこそ多くのことを成し遂げています。

――NPU(AI関連の処理を担うプロセッサー)のアップデートは?

アスガー氏
 NPUは今回、98%、性能が向上しました。また、消費電力も40%改善しています。

 また、Transformer(生成AIを支えるニューラルネットワークのモデル)をサポートできるよう、エンジンに変更を加えようとしています。今年は、マイクロタイル推論(推論を処理する際、データをより細かく分割して高速化をはかる仕組み)でTransformerの取り組みをサポートできるよう、さらに改良を加えたのです。

 NPUには共有メモリがありますが、今回は、より大きなモデルを常駐させるため、大幅に増やしています。

 そもそも半導体開発として、そうした選択をしたのは2年以上前のことです。生成AIが登場すれば、Transformerが登場することは分かっていたのです。長期的なプランニングのおかげで、これから来るであろう大きなトレンドを先取りすることができるというわけです。

 でも、個人的には、何年も前から注力してきたのは、整数ベースのプロセスです。そのおかげで、スマートフォンのような小さなデバイスでも使えます。NPUの性能を示す指標として、TOPS(1秒あたりの演算回数を示す単位)を用いることがあります。でも、モバイルデバイスについては、個人的に、1ワットあたり、かつ1秒あたりの能力を見たほうがいいと思います。

 また、AI関連では、パーソナライゼーションを挙げたいです。自分のニーズに合わせて生成AIのモデルを微調整できるというものです。これには、プライバシーの保護機能が密接に関わります。

 たとえば、場所や年齢などの個人的な情報をもとに回答を得られれば、AIからの回答は、その人へよりカスタマイズしたものにできます。でも、もしクラウドで処理する場合(パーソナライズできず)難しい。

 もし子供が質問する場合と、大人が質問する場合、クラウドで処理するAIアシスタントは同じ回答を返してくるでしょう。

 プレミアムなハイエンドではより多くの学習をしたAI、ミドルクラスではそれより少ないAIと、と機種によって、どの程度のAIモデルになるか変わってくるでしょう。

 Snapdragon 8 Gen 3に搭載するAIモデルのひとつ、OpenAIのスピーチ用である「Whisper」には、今後、さまざまなバージョンが登場します。たとえば、小型化されたWhisperというものがあり、低消費電力で対応できます。

――さまざまな機能が導入されていますが、過去のSnapdragon 8シリーズで発表された機能を見ると、メーカーが採用していないものもあります。

アスガー氏
 どの機能を組み込むかは、メーカーが決めることになります。ただ、個人的には、今回の(生成AIのスマホ上での稼働などの)機能は求められているものだと思う。

 すでにシャオミが発表した「Xiaomi 14」では、Xiaomi AI AssistantというAIアシスタントが組み込まれています。生成AIへの関心が高まれば、もっと多くのことができるようになるでしょう。

 また、クアルコムは今後、地域ごとに特化したモデルを用意しようと考えています。たとえば、英語にはLlamaがあり、中国語には別のモデルがある。フロントエンドで「Whisper」のようなモデルを使うことで、基本的に複数の言語をサポートすることができるわけです。

――ありがとうございました。