ニュース
「Snapdragon 8 Gen 2」ならスマホ上で「英語→2カ国語」同時翻訳ができる――そのAI機能のひみつとは
2022年11月17日 00:00
15日(現地時間)に発表されたクアルコムの新たなチップセット「Snapdragon 8 Gen 2」は、スマートフォンのなかでも、最上位のフラッグシップモデルでの採用が期待される製品だ。
現在のスマートフォンで実現できる、さまざまな機能が用意され、カメラ、機械学習(AI)、ゲーミング、サウンドなどで多くの特徴を備える。
ハワイで開催されているクアルコムのプライベートイベント「Snapdragon Summit(スナップドラゴン サミット)」では、発表後、カメラやAIの詳細が紹介された。まずはAI関連の特徴についてご紹介しよう。
多言語をスマホ上で同時翻訳
会場で披露された新機能のうち、国内外の報道陣の関心をひいたもののひとつが、「多言語翻訳」のデモンストレーションだ。
会場では、英語で話すと、その英語の文字起こしに加えて、「中国語」「スペイン語」への翻訳も同時に書き起こしする様子が披露された。
Snapdragon 8 Gen 2のAIエンジンを駆使して実現したもので、クラウドサーバーに音声データを渡さず、端末上(オンデバイス)で処理されている。
デモンストレーション用の端末のため、ほかの言語への翻訳はできない状態だったが、担当者によれば、3言語だけではなく、メーカー次第でもっと多くの言語への対応も可能という。
今回披露された多言語同時翻訳は、クアルコムがシャオミと協力して実現したものだ。
Snapdragon 8 Gen 2、そのAIエンジンの仕組み
話す言葉を認識して文字にする、という使い方は、この2年ほどで広がりを見せている。オンデバイスで実現しているのは、グーグルのPixelシリーズだが、LINEの「CLOVA Note」や、マイクロソフトの「Group Transcribe」といったアプリは、クラウド側で文字起こししている。
柔軟性を持った電力システム
まずクアルコムでは「Snapdragon 8 Gen 2」のAI処理を担うプロセッサー「Hexagon」で、専用の電力供給システムを新たに追加した。
担当者は「自宅にあるブレーカーシステムをアップグレードするようなもの」とたとえて説明。たとえば、Hexagonにかかる負荷が重ければ性能を上げ、その一方で少ない負荷であれば電圧を下げて、電力効率の最大化を実現する。
そうした電力供給の柔軟なシステムを用意した上で、クアルコムでは電力を下げるための方策も開発した。
メモリーの読み書きを最小限にする
そこで用意された手段のひとつが、チップ内のデータ移動、特にメモリーからのデータの読み書きを最小限にする、ということ。
たとえばスマートフォンのカメラ機能は、昨今、AIにより場面ごとに最適な撮影をする機能が用意されていることが多い。超解像(ズーム)、ボケ効果、ナイトモードといった具合だ。
それらの効果を実現するには、ニューラルネットワークが動作する。それぞれのニューラルネットワークは、インプットされた情報をもとに、いくつかの段階を経て動く。多くの場合は10種類の処理が実施されることになるが、その処理中、何度もメモリーへのデータの読み書きが発生する。
よくある手法として、データを細かく「タイル」に分割し、1つのタイル上で複数の処理(レイヤー)が実行される。データ制御やタイルごとの管理が必要になるが、メモリーへの読み書きを減らせるという。
そうしたタイル処理をさらに進化させ、クアルコムでは「マイクロタイル」と名付けた処理を取り入れることになった。ひとつひとつのデータをよりコンパクトにすることで、推論の高速化を実現。
マイクロタイルを数多く同時に動作させることで、複数のアクセラレーターを同時に動作できる。
従来よりもパワーアップした新たなHexagonプロセッサーであれば、数万個に分割されたマイクロタイルを十分に処理できるとのことで、短時間で、多くのことを処理できるようになった。同社では「新しいタイプの処理に、シームレスに適応できるようになる。驚くのほどの柔軟性がもたらされることになる」と胸を張る。
新たなハードウェアも追加
柔軟な電力システムと、さらに効率化したAI処理であるマイクロタイル、そしてパワーアップした新型のHexagonといった組み合わせに加えて、ハードウェアでアルゴリズムを処理する新たなアクセラレーションが追加されたほか、畳み込み処理を改善するための特別なハードウェアも追加された。
こうした仕掛けにより、Snapdragon 8 Gen 2のAI処理性能は、先代と比べ4.35倍にも伸びた。
マイクロタイル推論で実現する「多言語同時翻訳」
「マイクロタイル推論」という新たな処理の仕組みを取り入れたことで、スマートフォンカメラで撮影する際には、被写体のうち、顔、髪、背景の空などを認識してそれぞれにマッチした処理を適用する「セマンティックセグメンテーション」も可能になる。
シャープ製の「AQUOS R7」「AQUOS sense7/sense plus」でも同様の考えがすでに実現されているが、「Snapdragon 8 Gen 2」を採用するメーカーにとっては自社開発する余地が減り、ほかの部分の開発に注力できるようになる。
そうしたカメラ機能に加えて、新たなAI処理の具体的なユースケースとして開発されたのが、冒頭に触れた多言語同時翻訳。
これは「トランスフォーマーモデル」と呼ばれ、マイクロタイル推論により演算子の数を減らすといった工夫で実現させるもの。
冒頭で触れたように、デモンストレーションでは「英語」→「中国語」「スペイン語」への同時翻訳だったが、発表会のなかでは、さらに「日本語」へ同時翻訳する場面も披露されていた。
このほか、「Snapdragon 8 Gen 2」では、AI処理に関して、精度を落とさず、より低いメモリーの消費量で、高いパフォーマンスを得ることにも成功。複雑な演算だけではなく、比較的シンプルな演算となる「INT4」をサポートし、60%の省電力と、90%の性能向上となった。
「Snapdragon 8 Gen 2」のAI処理では、ハードウェアの追加による処理性能の向上だけではなく、マイクロタイル推論(こうであろう、という推測)の導入や、INT4対応、柔軟な電力制御といった仕掛けを取り入れ、「スマホ上」で「リアルタイム」での複雑な「多言語翻訳」を実現。メーカーにとっても、新たな体験をユーザーへ届けやすくなったと言えそうだ。