|
マルチメディア研究所 所長の栄藤稔氏(左)、同研究所音響信号処理研究室の松岡保静氏(右)
|
URLなどのテキストデータを音に載せて配信し、簡単に携帯電話に取り込める、そんな不思議な技術がNTTドコモから発表された。「音響OFDM」と呼ばれるこの新技術は、無線LANなどで使われるOFDM変調技術を音楽などの音声分野に適用するというもので、今後、携帯電話への応用が期待されている。
インタビュー取材の途中には、PDAとノートパソコンを使ったデモンストレーションも行なわれ、携帯電話での実用化が見えてきた印象を受けた。今回、同技術について、音響OFDMを開発したNTTドコモのマルチメディア研究所 所長の栄藤稔氏、同研究所音響信号処理研究室の松岡保静氏に話を聞いた。
■ 音響OFDMデモンストレーション、その仕組みは?
――音響OFDMとはどのような技術になるのでしょう?
松岡氏
テレビCMなどでURLが表示されている場合があるかと思いますが、こうしたURLを携帯電話で手入力するのは非常に面倒です。今回の技術は、音声にデジタルデータを載せることで、手軽にデータを受信できるようにするというものです。このデモ音声には実際にデータが載っている状態なんですよ。
――普通に聞こえますが、もうこの状態でデータが載っているのですか?
松岡氏
はい、音を聴かせてから大体2~3秒で読み取りが可能です。
――1~2秒でどの程度の情報が取れますか?
松岡氏
アプリケーションによりますが、大体1秒で100バイトぐらいの情報が取れます。URL程度の情報であれば100バイトで充分なので、1~2秒といったところでしょう。
|
|
|
ノートパソコンに接続された一般的なスピーカーを使ってデモが行なわれた
|
取り込む側の端末のごく普通のPDA端末
|
音を聞かせると、数秒でURLが取得できた
|
――どういう仕組みで音声にURL情報などが載るのでしょう?
松岡氏
まず、オリジナルの音楽から高周波部分をカットしてしまいます。そうすると、通常の音声よりも若干こもった音になります。次に、音声に埋め込むデータをOFDM変調するのですが、単純にOFDM変調しただけではフラットなホワイトノイズのように、ジーッという音になってしまいます。そのまま音声に埋め込めば、ホワイトノイズが気になることになります。
これを、元々の音楽の高周波成分のスペクトルに合わせてあげると、フラットなホワイトノイズが元の音楽に近い形になります。合成することで、音声の中にほとんどわからないようにデジタルデータを埋め込むことが可能になり、ノイズの発生を抑えることが可能です。なお、合成はソフトウェア上でできるようになっています。
|
|
音響OFDMの原理
|
OFDM周波数、時間スロット割り当て
|
栄藤氏
用途はいろいろ考えられますが、テレビやラジオなどのCMにURLを載せることで、ユーザーをWebサイトに誘導することが可能です。また、スーパーマーケットや、駅などで、バーゲン情報や駅の運行情報を流せます。あとは、災害利用も考えられますね。技術はできましたが、使う方が現われないとマーケットができないので、報道発表して導入する企業を探している状況です。
我々の研究所は元々、音声の符号化をやっており、横須賀には無線通信技術が専門の研究所もあります。今回の技術は、無線の技術を音波に持ってくるとどうなるか、という研究の成果です。高い周波数成分を元のスペクトラムに合わせて形成すると、人間の耳には雑音として聞こえにくいということはわかっていたので、今回それを応用しました。
ここまで1年かけて今回の技術を開発しましたが、元々この研究がスタートした時点では、音響OFDMがゴールではありませんでした。携帯電話にはマイクもカメラも全て搭載されており、カメラにはQRコードといった機能が用意されています。Bluetooth対応など今後さらにユビキタス化が進む中で、残されたものはマイクとスピーカーのユビキタス化と捉え、それを使って何ができるか考えました。開発までにさまざまな問題が出てきましたが、松岡がそれを1つずつ潰していきました。
|
想定される用途
|
――プッシュ配信型メディアとしても利用できますか?
松岡氏
原理的には可能です。しかし実装するにあたって、プッシュ型だと常にロックオンして解析し続ける状態となるため、バッテリー消費が激しくなってしまいます。ユーザーがアプリケーションを起動して、ロックオンを開始後、情報を取るといったプル型になるでしょう。
栄藤氏
イメージは、音のQRコードのといったところですね。
|
「音には何かしら合図音などが必要になるのではないか」と松岡氏
|
――屋外などでは、雑踏など他の音の影響を受けそうですが、データをちゃんと拾えるのでしょうか?
松岡氏
雑音の種類にもよりますが、拾えると思います。環境雑音というのは基本的に低域に集中しているものが多いので、拍手や金属音といった高域の雑音でなければ問題なく読み取れます。
――高周波をカットするために音質が若干落ちるということですが、高音質が求められるものには適していないということですか?
栄藤氏
現在の想定では、安い普通のスピーカーで出力可能で、かつ携帯電話のマイクロフォンで拾えるということを考えています。0~9キロヘルツの帯域のうち、高周波の3キロヘルツを使っています。音楽など、上が16キロヘルツまで使えるのであれば、データをさらに高い周波数に割り当てて、ほとんど聞こえないようにすることも可能です。これは技術の問題というより、どこに当てはめるかという問題ですね。
――auでは、音楽を携帯電話に聴かせて楽曲を検索するサービス(聴かせて検索)を展開していますが、今回の技術との違いはどこでしょう?
松岡氏
auのサービスは、電話をまずサーバーに繋げて、電話越しに音を聴かせてサーバー側で音の特徴などから楽曲を検索するというものです。大きな違いは、音響OFDMは、サーバにアクセスせずにその場でデータを取得できるという点です。もちろん送信側であらかじめデータを入れておく必要がありますが、楽曲情報以外にもURLやメールアドレス等、多様なデータを入れられる分、さまざまな展開が可能だと考えています。
――音声に他のデータが含まれていることが聴いただけではわからないと思いますが、エンドユーザーに対してどういった周知を考えていますか?
松岡氏
何かしらの合図音を入れたり、テレビであれば映像で伝えるということになるのではないでしょうか。この音が聞こえたら、何かその音声には信号が入っているというような音が必要かもしれません。逆に、合図音を使うことでノイズをマスキングすることも可能で、合図音に紛れてノイズを多く入れることで、よりたくさんのデータを入れることも可能です。
栄藤氏
実はいろいろな声をいただいていて、ノイズが気になるからもっとノイズを消すべきという意見と、逆に、わからないとデータが入っているかさえ判断できないので、インジケーターを入れて欲しいという意見があります。今回の技術はそのどちらにも対応しており、あとはマーケットの声次第ですね。
――音源と携帯電話の距離に制約はありますか?
松岡氏
ボリュームとの関係もありますが、現状は1mぐらいです。テレビの視聴範囲でデータが拾えるようにもう少し感度が欲しいとところです。
――他キャリアでも利用できるようになるのでしょうか?
栄藤氏
QRコードのように他キャリアにも解放していきたいと考えています。
■ 携帯電話への実装に向けた課題
|
携帯電話に応用するためには、16キロヘルツサンプリングが課題になるという
|
――携帯側にモジュールなどを追加する必要がありますか?
栄藤氏
現状、携帯電話が音を伝えるためのサンプリング周波数は8キロヘルツとなっています。しかし、今回の技術を導入する場合、8キロヘルツだと性能が落ちます。デモでは9キロヘルツまで使っていますが、9キロヘルツまで使うということは、もう少し高い周波数でサンプリングする必要があるため、純粋に技術屋からみれば16キロヘルツサンプリングが理想ですね。
松岡氏
Windows Mobileなどのスマートフォン系は現状でも対応できます。今回デモで利用したPDAもそうですが、PDAやスマートフォンでは、44.1キロヘルツサンプリングの録音ができるので問題なく利用できます。
栄藤氏
16キロヘルツサンプリングについては、ハードウェア的にそれほど問題はないと考えおり、むしろソフトの口が開いているかどうかが問題だと思います。我々の部署では、電話音声の品質向上のために、将来的はサンプリング周波数は16キロヘルツまで上げたいと考えています。
それは今回の音響OFDMだけでなく、エコーキャンセル、ノイズリダクション、将来的なVoIPなどを考えると、16キロヘルツサンプリングの方がメリットがあるためです。もちろん、ビットレートは落ちますが、現状の8キロヘルツでもサービスができないわけではありません。
――携帯電話に載せる上での課題というのはやはりそこですか?
栄藤氏
そうですね。今後、音声関係のサービスをより良い物にしていく上で、16キロヘルツサンプリングが一番大きなネックだと思います。
――商用化の時期について研究所としての意見を聞かせて下さい。
栄藤氏
商用化に関しては何も決まっておりません。あくまで理想の話ですが、2008年夏頃にこのような技術が具現化できればと考えています。
――2008年夏頃に音響OFDM以外の音声処理が登場する可能性もあると?
栄藤氏
あり得ない話ではないですね。
――イベント会場などでも使えそうですね。
栄藤氏
例えばJavaアプリで利用するようになったとして、コンサートに行った人がJavaアプリをダウンロードして、会場で流れる音など使うのも面白そうですね。Javaアプリでできるようになると敷居が低くなるのではないでしょうか。Javaアプリでの利用を実現するためには、16キロヘルツのAPIができればいいんですが。
――やはり、16キロヘルツにかかってくると?
栄藤氏
そうですね。ただ、我々が2008年頃としているのは、今後、携帯のプラットフォームが様々なアプリケーションを許すような環境が整ってくると考えるからです。現状に楽観はしていませんが、悲観もしていません。
――本日はお忙しい中ありがとうございました。
■ URL
ニュースリリース
http://www.nttdocomo.co.jp/info/news_release/page/20060413.html
NTTドコモ マルチメディア研究所
http://www.lab.nttdocomo.co.jp/
■ 関連記事
・ ドコモ、音声でURLなどを送信できる「音響OFDM」開発
・ 第178回:OFDM とは
(津田 啓夢)
2006/04/26 14:01
|