ニュース

米クアルコム、IoE時代を見据えた最新の取り組みを披露

Snapdragonの高度な映像合成、オーディオ、最新認識技術をデモ

米クアルコム本社にて、各国メディア向けのイベントが開催

 米クアルコムは現地時間12日~13日にかけ、本社のあるサンディエゴにて同社の最新の取り組みを披露する「International Editor's Week 2015」を開催した。さらに14日には、サンフランシスコで「From the Internet of Hype to the Internet of Everything」と題したイベントも行われ、「Internet of Everything(IoE:あらゆるもののインターネット)」周辺の製品・技術・動向を紹介するイベントも行われた。

 ここでは、「International Editor's Week 2015」で披露された主にSnapdragon 820に搭載される新機能の数々に関するデモンストレーションの内容についてお伝えする。

カメラ、オーディオ性能が進化。「Zeroth」技術も

「ChromaFlash」で合成されたHDR画像は、ハイライト部も暗く沈んだ部分もきれいに映し出す

 Snapdragon 820では、ビジュアルとサウンドにかかわる機能や性能が大幅に向上している。例えばカメラでは、ライトによる撮影を組み合わせたHDR撮影機能「ChromaFlash」がサポートされ、ライトありとなしという2枚の大きく露出の異なる写真を合成し、1枚の写真を作り出せる。デモでは、ライトなしの場合に暗く沈んでいた部分が明るく映し出され、ライトありの場合には明るすぎて浮いているように見えた箇所が、より自然に処理された写真が生成されることを紹介した。

 撮影後でもピント合わせが可能になる「UbiFocus」機能も搭載される。自由自在にピント位置を変更できるとして一躍注目を浴びたデジタルカメラのLYTROだが、Snapdragon 800シリーズでもそれに近い機能を実現する。具体的には、ピント位置がそれぞれ異なる最大5つまでの映像を瞬時に取り込み、それらを合成することで、あたかもピント位置を後から選択できるような形で写真撮影が行える。従来のスマートフォンに搭載されるような小型のレンズ・センサーをそのまま利用でき、あらゆるフォームファクターに対応する点がメリットとされる。

手前や奥、または全体にフォーカスの合った映像を作り出せる「UbiFocus」
「OptiZoom」のデモでは、カメラではなくキャプチャー済みのグラフィックが用いられた

 センサー上でいわゆる超解像処理を行う「OptiZoom」もカメラ機能の進化ポイントの1つ。撮影時にわずかに異なる2フレーム分の映像を処理することで、例えば手ぶれしがちなシチュエーションでも高い解像感のある映像を記録できる。

単純に拡大し、補正した例
「OptiZoom」により処理が施された例

 Snapdragon 800シリーズでハードウェアエンコードが可能になったHEVC(H.265)形式の動画のメリットについても改めて解説。デモでは同一の4K映像を現在主流のH.264形式で圧縮したものと、HEVC形式で圧縮したものを並べ、およそ半分のビットレート、ファイルサイズであるにもかかわらず、見分けのつかないクオリティで再生できることを示した。

7.1chサラウンドやDTS Headphone:Xを体験できた

 オーディオ面では、天井スピーカーを含めた5.1chのDolby Atmosに対応。DTSによる7.1chサラウンドや、ヘッドフォンで同様の音場を作り出せるDTS Headphone:Xもサポートする。デモではそれぞれのサウンドを実際に体験でき、Dolby Atmosについては宇宙船が通り過ぎる時の重低音を伴う効果音、森の中で飛び立つ鳥の羽ばたきなど、頭上を通り過ぎる様子がリアルに感じられた。またDTS Headphone:Xによるヘッドフォンを使った試聴では、事前に聞いた物理的な7.1chによる再生と区別がつかない音像定位と臨場感を実現しており、思わずスピーカーで鳴らしているのではないかと感じヘッドフォンを外して確認するほどだった。

ビル街の風景では屋外であること、空や建物があり、人がいないことを自動で判断

 同社が今後のモバイル向けチップセットで推し進める「Cognitive computing」構想における要素の1つとして、ハイレベルな画像認識を行う「Zeroth」技術のデモも行われた。端末のローカルに保存されたデータベースを元に、カメラで映している内容がどういったシーンであるかが詳細に判別されるもので、例えば風景であれば空や山を映していることを瞬間的に識別するほか、猫を映したものであれば被写体が動物で、それが猫であることや、撮影場所が屋外か室内かも判断する。これにより、シーンに応じた最適な撮影設定やエフェクトの追加を自動で行うなどして、今まで以上に高品位な写真や動画を残せるようになる。

料理の映像はしっかり食べ物であることを認識
猫を認識。屋内で撮影したことも分かる
高度な3Dグラフィック性能も披露

 Zerothではさらに機械学習による手書き文字の認識も可能だ。紙面にラフに記された手書きの英文を対象に処理を行うデモでは、全ての文字を正確に英文フォントで再現しレイヤー表示した。認識の元となるデータは、前述のシーン判別と同様に端末のローカルデータベースとなっており、クラウドを利用したシステムと比べはるかに高速に処理できる点がメリットだとした。

手書きの英文を対象に認識処理。意図しているであろう文字を正確に再現した

3次元指紋認証、ボイスコマンド機能をハードウェアで実現

「Sense ID」による指紋認証機能をハードウェアでサポート

 「Sense ID」と呼ばれる指紋認証機能も、今後登場する新しいSnapdragonでサポートされる。超音波を利用した指紋センサーによりユーザーの指紋を3次元データとして認識する仕組みで、指が濡れていたり、センサー上にガラスや金属、プラスチックといった素材のカバーが施されているような状態でも問題なく指紋を判別できるという。

 「Snapdragon Voice Activation」は、iPhoneに搭載されているSiriやAndroid端末のOK Googleのように、ユーザーの声で端末を操作できるようにする技術。ただし、SiriやOK Googleがあくまでもソフトウェアで実現している機能であるのに対し、Snapdragon Voice Activationはハードウェア(チップセット)で実装している点が大きく異なる。

 デモでは、「Hey, Snapdragon」と呼びかけるだけで端末から短いサウンドを発して声に反応する様子を披露。このアクションを契機にカメラの起動やメール受信など、端末のさまざまな機能を声でコントロールできる。

 また、端末がスリープ状態(ディスプレイ消灯時)であっても機能が有効である点も特徴。この利点を活かした用途として、端末をどこに置いたか忘れてしまったケースが考えられるとした。実際に「Where are you?」と声をかけると端末のスピーカーから音を出し、端末がどこにあるか即座に気付けることを示した。このために必要な待機電力は最小限に抑えられ、バッテリーに与える影響もごくわずかだとしている。

隣の部屋から送出しているLTE Broadcastによる電波を実際に受信して再生する様子

 最後に、特定の狭いエリアでの映像・音声配信に特化した「LTE Broadcast」についても解説があった。LTE通信を用いてデータを同報配信する技術で、同時に受信するユーザーが1人であっても数千人以上であっても使用する通信帯域は変わらず、安定した高品質な映像などを低負荷で多くのユーザーに届けられる。複数の映像チャンネルを提供することもでき、コンサートやスポーツ中継に適していると話すが、コンテンツ提供側でビジネスモデルの確立が進んでおらず、技術・インフラはすでに整っているものの、採用例はまだ多くないのが実情だ。

日沼諭史