みんなのケータイ

F-04Gが搭載するSnapdragon 810の次の世代から、人工知能にもとづく機能が搭載される

 今、人工知能分野界隈では「ディープラーニング」と呼ばれるテクノロジーが激アツらしい。過去に2回訪れたという人工知能ブームだが、今回のディープラーニングは技術的に有望とされ、学会・研究レベルで大きな成果を上げているだけでなく、すでに商用レベルで実用化していることもあり、期待は大きいようだ。

 人間の頭脳にあるとされるニューロンとシナプスの仕組みを模倣し、コンピューター自らが多数のデータに共通する“特徴”を見つけ出して“深く”学習することで、例えば写真に写っているものが何であるかを認識できるようにするのが、ディープラーニングを用いた人工知能。2012年にCPU 16000コア分のコンピューターを3日間動かして1000万枚の画像をディープラーニングの技術で学習し、“猫”や“人間”の顔を認識できるようにしたというGoogleの研究成果が発表されたのはまだ記憶に新しいところ。

クアルコムのイベントで見たZeroth技術の一端。瞬時に写しているものが何であるかを判断する

 スマートフォン向けチップセットを開発するクアルコムも、今筆者が使っているARROWS NX F-04Gが搭載するSnapdragon 810の次の世代、Snapdragon 820から「Zeroth」という認識技術プラットフォームを搭載する。これもディープラーニングの基礎である機械学習の仕組みを応用していて、あらゆるものを認識し、ユーザーエクスペリエンスの向上に役立てようとしている。ディープラーニングや人工知能はもはやスマートフォンにとっても関係の深いものになりつつあるわけだ。

 で、そんなディープラーニングは、画像だけじゃなくて自然言語処理など、さまざまな分野へ応用が始まっていて、ことによってはライターである我々の仕事もいずれなくなってしまうかも! みたいな危機感から、近頃はいろいろ調べてディープラーニングの仕組みを試せるPC環境を作ってみたりもしていた。では、PCじゃなくてスマートフォンで、今すぐにディープラーニングを体験できる方法ってあるのだろうか?

 スマートフォン周りでディープラーニングにまつわる分かりやすいところとしては、「Google フォト」かもしれない。一定画質までの写真と動画なら、容量無制限でオンラインストレージにバックアップできるというアプリ・サービスだ。実はアップロードした画像・動画は裏で自動的にタグ付けされていて、キーワード検索で画像を見つけることができる機能にディープラーニングが用いられている。また、Androidの音声認識機能でもディープラーニングが活用されているようだ。

 他にも探してみると、Yahoo!が提供している「Yahoo! JAPAN」「Yahoo!カーナビ」「Yahoo!地図」「Yahoo!乗換案内」などのアプリでも、それぞれが搭載する音声認識エンジン「YJVOICE」でディープラーニングを用いているという発表があった。

Google フォトでは画像検索の技術にディープラーニングが用いられている
毎日のように使っている「Yahoo!乗換案内」。この音声認識にもディープラーニングが!

 しかし、Google フォトの場合は検索しても画像がヒットする確率がまだまだ低いみたいだし、音声認識に関わる機能だと、ディープラーニングのメリットがいまいち見た目で感じられない。もっとはっきりと、ディープラーニングのすごさや面白さに気付けるアプリがないものか、と思って探したところ、そのものズバリの「Deep Learning」というアプリが見つかった。

 このアプリでは、写真撮影した対象物が何に分類されるものであるかをサーバー上で処理して認識し、結果を確率表示する。試しに目の前のMacBook Airを撮影してみると、「laptop」や「notebook」を候補に挙げたので、完璧に正解。次に椅子を写してみると「folding chair」(折りたたみ椅子)と認識されたが、確かにちょっとユニークな形の椅子なので、少し誤認されても仕方ないかも。

MacBook Airの認識結果
IKEAの椅子は折りたたみ椅子と判定された

 仕事に使っている一眼レフカメラを撮影すると、最初はなぜか「knee pad」(膝当て)になってしまったものの、花形フードを外して角度を変えてみると、正しく「reflex camera」(リフレックスカメラ=レフ付きのカメラ)として認識された。学習内容はまだ完全ではないようだけれど、普段自分が見ているものを人工知能がどのように判断するのか、なかなか興味深い結果が出たりするので、面白い。

一眼レフカメラはなぜか「膝当て」として認識
花形フードを外して角度を変えてみると、無事正確にカメラとして認識された
クルマもほぼ正しく認識された
しかし横浜家系ラーメン(食べかけ)は「鐘」に見えるらしい
ルンバは「サッカーボール」だ

 ごく最近の話題では、人間との会話の中で人工知能が「怒った」というトピックもあった。ディープラーニングによってスマートフォンや世界がどんな風に変わっていくのか、本当に楽しみな時代がやってきたように思う。仕事がなくなってしまうのはちょっと困るけれど。