ニュース
「スカイツリーは何階建て?」に回答、Google音声検索の新機能
(2013/11/29 13:28)
グーグルは29日より、音声認識機能を使った「Google音声検索」の新機能を提供する。新機能は、話し言葉による質問を認識して、回答するもので、Android 4.1以上、iOS 6.0以上のスマートフォンやWebブラウザ「Chrome」搭載のパソコンで利用できる。
新機能によって、「スカイツリーは何階建て?」「イタリアの首相は誰?」「エッフェル塔はどこ?」といった質問を投げかけると、回答が得られるようになる。
Google Nowもあわせて進化。現在地にあわせて「終電まであと○分」などを示したり、空港で登場する飛行機の情報などをメールの情報をもとに案内したりできるようになる。日本語での音声入力を実現するためには、かな・漢字が混じっていたり、同音異義語が多かったりする点が課題だったという。
説明会では、ケーキのレシピを検索し、調理に失敗すると周辺のケーキ店を探したり、ドライブで目的地までの道のりや目的周辺の観光情報をGoogle音声検索、およびGoogle Nowで調べるデモンストレーションが披露された。
広範な検索結果をお手軽に
音声検索で、自然な話し言葉が認識できるようになったことが大きな進化のポイントとなる今回。どのような狙いがグーグルにあるのか。
グーグルの製品開発本部長である徳生健太郎氏は、「去年、検索ワードに関連する情報をまとめて表示するナレッジグラフを発表するなど、グーグルの検索は進化してきた。これは“完璧な検索エンジンはユーザーが本当に知りたいことを理解して、ユーザーが欲しい情報を的確に返すものだ”というラリー・ペイジの考えに基づいたもの」とこれまでの経緯を説明する。
そうしたコンセプトの下、グーグルでは「アンサー(回答)」「カンバセーション(会話)」「アンティシペイト(予測)」という3要素を柱としており、今回の音声検索も、その3つの要素を満たした機能となる。他社でも話し言葉を認識して、質問に回答する「しゃべってコンシェル」(NTTドコモ)のようなサービスはあるが、徳生氏は「4年前から音声検索自体はあるが、基本的にその結果はWeb検索をベースにしており、一番適当な結果を表示するようにしている。グーグルの幅広い検索と、たとえばパブロ・ピカソについて検索すると、出生地や没年、作品までWebページや画像、ニュースをまとめてナレッジグラフとして示す」とコメント。つまり、グーグルの強力なWeb検索と、それらの検索結果を分類し、わかりやすい形で1つにまとめるナレッジグラフを、音声検索で手軽に利用できることがグーグルならではの要素になるという。
会見後の囲み取材に応じた徳生氏は、方言などは今後の積み重ねでの対応になるとしたほか、これまでのWeb検索はワードを区切って入力するスタイルが一般的だったことを指摘。そうした検索方法は、ITリテラシーの高い層は理解しているものの、これからより一層スマートフォンが拡がる中で、幅広い層にとって自然な話し言葉での検索は利便性が高いとする。さらに、スマートフォンやタブレットだけではなく、テレビ、腕時計型デバイス、メガネ型デバイスなど、キーボードを利用しづらい、あるいは利用できない機器では音声検索というインターフェイスは「かなり重要」とも語っていた。