ニュース

ドコモが「AIエージェントAPI」開発、2018年度に新サービス

オープンパートナーイニシアティブで共同開発も

 NTTドコモは、「AIエージェントAPI」を開発した。2018年度の早い時期に新たなAIサービスを提供する。またAIエージェントAPIを外部にも開放する「オープンパートナーイニシアティブ」も推進する。

 AIエージェントAPIを開放することで2020年までに100社の参加を目指す。対応するデバイスやサービスが増えれば、ユーザーが「クルマの鍵、どこに置いたっけ」「タクシーを呼んで」「今日の材料で作れる料理は?」と問いかけると、AIが自然な会話で応対し、サービスやIoTデバイスを使えるようになる。

3つのエンジン

 ドコモが開発したAIエージェントAPIは、NTTグループのAI「corevo」のひとつ、「先読みエンジン」「多目的対話エンジン」「IoTアクセス制御エンジン」の3つで構成される。

 「先読みエンジン」では、ユーザーの現在地や普段の行動、メールの内容などをもとにユーザーにアドバイスをする、といったアクションを起こす。たとえば11時~13時に宅配物が届くという場合、ユーザーが外出中で、普段は自宅か職場にいるといった行動特性をもとに「配達時刻に間に合わない」と判断すれば、AIエージェントはユーザーに対して「配送時間を変更しませんか?」と先読みして提案してくれる。ユーザーにアドバイスするための根拠の情報は、ドコモメールやGmailなど、アプリやユーザーの許諾次第で幅広く対応できる見込み。それだけではなく、運送会社がオープンパートナーイニシアティブに参加すれば、運送会社のデータベースから直接、ドコモのAIエージェントAPIへ「このユーザーへ〇日△時、荷物が届く」と情報を渡すことも可能になるよう検討が進められる。

先読みエンジン

 「多目的対話エンジン」は、18億回以上、利用された「しゃべってコンシェル」などで培う自然言語処理技術で、より自然な対話を実現する。

多目的対話エンジン

 「IoTアクセス制御エンジン」は、対話で家電などをコントロールできるようにする。たとえばテレビやエアコン、照明などのON/OFFを声で行えるようにする。

IoTアクセス制御エンジン

リアル店舗の高島屋、飲食店情報の食べログが参画、デバイス開発はインテルが支援

 23日に開催された説明会では、高島屋、食べログ(カカクコム)、インテルの関係者も登壇し、AIエージェントAPIを活用する方針が示された。具体的なサービス像はまだこれからだが、高島屋常務取締役 営業推進部長の髙山俊三氏は「行動体験の変革は大きなテーマ。一人一人へ親身になって新しいおもてなしサービスを創ることに貢献したい」と意欲を見せる。

左から高島屋の高山常務、NTTドコモ副社長の中山俊樹氏、インテルの江田社長、カカクコム食べログ担当の村上取締役

 カカクコム取締役で食べログ担当の村上敦浩氏は、ドコモと「dグルメ」で協業し1年間で100万ユーザーを獲得した実績を示しつつ、「食べログの一番の強みは、80万店舗、2000万件の口コミだが、検索してたどり着かないと目にできない。データはあるが100%活用しきれていない。AIにより、ユーザーに最適なお店の情報を提供できるようになるだろう」と未来図を描く。

 こうしたサービス事業者の立場以外でも、AIエージェントAPIを活用できるよう開発者コミュニティも整備される予定で、技術的な詳細は28日から開催される展示会「AI EXPO」で紹介される。また協業するインテルはデバイス開発を支援する立場となり、「基盤技術は比較的オープンな形で拡げていきたい」(インテル代表取締役社長の江田麻季子氏)という。

AIエージェントAPIの価値
当初のパートナー
AI・人工知能EXPOに出展

メインエージェントとエキスパートエージェント

 説明会では、報道関係者向けにAIエージェントAPI対応のサービスやデバイスの利用シーンを紹介する映像が披露。ここでは、ぬいぐるみに話しかけたり、冷蔵庫や洗濯機のエージェントを対話しながら操作したりするといった場面が紹介された。

ドコモの大野氏

 ここで、説明をしたNTTドコモ 執行役員 R&D戦略部長 兼 イノベーション統括部長 大野友義氏は「お気づきにならなかったと思うが、機器やサービスごとにエージェントの声が異なる。つまりそれぞれにエージェントが存在する」と自信ありげに語る。

 ドコモの「AIエージェントAPI」は、ドコモのみならず、サービスを提供する企業、あるいは家電などIoTデバイスを提供する企業と、外部も利用できる。そこで、ユーザーと相対するエージェントとしては、普段から身近にいる「メインエージェント」と、サービス事業者やIoTデバイスごとに用意される「エキスパートエージェント」の2種類が存在する、という特徴を持つ。

 メインエージェントは、ドコモが来春、スマートフォンやタブレット上での利用を想定して提供するものだが、それだけではなくたとえばテレビメーカーがメインエージェントとしての機能をテレビ製品に実装する、といったこともできる。この場合、スマートフォンやテレビでエージェントの性格や声が変わる可能性はあるが、接続するサーバーは同じということになるようだ。

メインエージェントとエキスパートエージェント

 一方、「エキスパートエージェント」は、サービスごと、機器ごとに存在することが想定されている。タクシーを呼ぶ、百貨店のサービスを通じてショッピングする、音楽を聴く、家電を操作する、料理を作る……それぞれの場面で異なるキャラクターが、ユーザーと会話して、ユーザーのやりたいことをかなえていく。その土台として、今回の取り組みでは、先述したようにドコモから自然な対話になるためのテンプレート、キャラクターの声の音声合成、あるいは音声認識といった“多目的対話エンジン”が提供されることになる。

 メインエージェントとエキスパートエージェントの間で、基本的に個人情報はやり取りされない。そこでユーザーはそれぞれのサービスでログインすることが想定されている。初期設定は面倒になるかもしれないが、一度紐付けてしまえば、あとは連携しやすくなる、と言えそうだ。ログインする際も、dアカウントに制限されることはないという。また現時点で家族の声など、複数のユーザーの声を聞き分けることはしていない。

 今回の発表を受け、まずはパートナーとして参画する企業の増加を目指すほか、今秋にはトライアルサービスが登場する予定。

今後のスケジュール