みんなのケータイ

ドコモ「おはなしメモ」をメイン回線で約1カ月使ってみた

【Galaxy Note8 SC-01K】

 音声通話の通話内容を自動的にテキスト化してくれる、ドコモの「おはなしメモ」を約1カ月ほど使ってみました。

 「おはなしメモ」は10月18日よりAndroid向けにトライアル提供が開始されており、月額料金などなどは無料。利用にあたってオプション申込なども不要、アプリをインストールするだけで、簡単に利用開始することができます。

 「おはなしメモ」は、ドコモのネットワーク上で音声→テキスト化の処理を行っているため、ドコモの音声通話回線を契約している必要がありますが、端末に関しては特に制限を行っていないようで、ドコモが発売していないSIMフリーのAndroidスマートフォンにもアプリをインストールすることは可能でした。

 「おはなしメモ」はアプリをインストール後、簡単な設定を済まれば、通常通り音声通話を発信・着信することで、通話内容が自動的にテキスト変換されますので、音声通話の際にアプリを操作したり、設定を変更したりする必要はありません。「おはなしメモ」を使わない時と比べて、特に負担を増やすことなくサービスを利用できる点はお手軽です。

Android 6.0以降では、自分の声のみ変換可能

 今回、「おはなしメモ」を使ったのはドコモのAndroidスマートフォン「Galaxy Note8 SC-01K」。「おはなしメモ」は、Android 6.0以降の機種では(OS側の都合によって)自分の声のみを音声→テキスト化することができます。このため、比較的古い機種で同サービスを利用する場合を除いて、原則として「自分の声をテキスト化することができる」と捉えて差し支え無いでしょう。

 筆者は、ドコモ回線をシンプルプランで家族との音声通話およびその他音声通話の待受用に、別途契約しているワイモバイル回線(1回あたり10分の通話定額コミ)を、家族以外への発信用に使い分けしているため、「おはなしメモ」によってテキスト変換される通話の多くは、家族との音声通話でした。

 率直に言うと、家族との通話に関しては、フォーマルな会話というよりもかなりくだけた表現を多用しているためか、「おはなしメモ」でテキスト化された内容を見てみても、何に関する話をしているのか、またどのような内容なのか、自分自身でもさっぱり意味がわからない、ということが多々ありました。

 それでも、会話中に含まれる時間などの情報は比較的正確にテキスト化されています。ざっくり言えば、日時や場所などの定型フォーマットに落としやすい情報についてはテキスト化される精度が高く、いわゆる「おしゃべり」に分類されるような内容については、テキスト化される精度が低いようです。

 一例として、近しい家族にお祝いをもらった際にお礼の電話をした際の通話内容は、以下のようにテキスト化されていました。

 テキスト化された内容は「もしもし三輪さん」から始まっていますが、恐らくこれは「エミおばさん」と話した内容が、どうやら「三輪さん」として認識されたのではと思います。このように、固有名詞の変換はどうしても精度が低くなるようです。正直、この内容だけでは、何を喋ったのか、自分自身でもよくわかりません。

 さらに難読だったのは、以下のメモです。「うん。馬場泰樹」から始まっている内容ですが、筆者には「馬場泰樹(ババナオキ?)」という知人は思い浮かびません。念のため連絡先を同名で検索しても一切ヒットしませんでした。

「三輪さん」って誰だっけ?
難問だった「馬場泰樹」……って誰だっけ?

 通話時間や発信元などなどから推測した結果、これは、「うん。ババね、OK」という会話内容が誤変換された結果のようです。

 「馬場=ババ」という推測ができたのは、テキスト化された通話の最後のほうで「馬場の番号何番だ」という変換がされており、これが「ババの(携帯)番号何番だ?」という質問であることが、自らの記憶と照らし合わせて理解でき、遡って冒頭の「馬場泰樹」と変換された発言の意味を推測することができました。

 一方で、ある程度フォーマルと言いますか、家族間でしか通用しない固有名詞や表現が使われることのない相手との通話内容については、汎用的な表現を使うことが多いためかテキスト化の精度が高く、「ある程度推測がつく」ようにテキスト変換が行われていました。

 これは、会話するスピードが家族とのおしゃべりよりもゆっくりで、テキスト化しやすいことも理由なのかもしれません。

ドコモインフォメーションセンターへの問合せ内容

 「ドコモオンラインショップで買ったスマートフォンのSIMロック解除に失敗する」という趣旨で、ドコモに問合せをしてみた際にテキスト化された内容は以下のようになっています。

 文字列で理解しようとすると意味が通らない箇所もありますが「音」に意識をすると、ある程度意味がわかるのではと思います。

 例えば、冒頭の文章では「すいません、ちょっとお伺いしたいんですが、ドコモオンラインショップで購入したスマートフォンのSIMロックの解除を、Webサイトから行おうとしたんですけれども、エラーコードが出て解除ができないんですが」という趣旨の質問をしています。

 「おはなしメモ」でテキスト化された内容は、ややおかしな箇所もあるのですが、意味はある程度通じるのでは(少なくとも、言った本人の記憶と照らし合わせれば)という感じで、特別に親しい相手以外への、一般的な表現を使った会話についてはある程度の精度で変換が行われるようです。

 Androidスマートフォン向けには、音声通話の内容をそのまま音声データとして保存、クラウド同期できるアプリケーションも珍しくない中で、音声通話内容がテキスト化されることの意義は、ある程度正確に変換された内容が、テキスト検索して目的の情報に辿り着ける、またはコピー&ペーストしてスケジュール登録などに使えることにあると筆者は考えます。

 しかしながら、現時点では「おはなしメモ」に頼って通話内容をテキスト化するよりも、通話中もしくは録音データに基づき人間が理解した内容を「テキストメモする」という方が手っ取り早いように思います。

 ただし、音声通話の内容そのものにリンクして、テキスト化された内容がデータとして扱えるようになれば、確実な内容を知りたい時は音声データにアクセスして、サマリーを知りたい時はテキスト化された内容をチェックという使い方ができるので、変換されたテキストデータだけでなく、音声データも保存するようにしてくれれば、と思いました。