ケータイ用語の基礎知識

第853回:EVS とは

高品質で音を伝えられる音声コーデック

 携帯電話で通話するとき、音声をデジタルデータに変え、電波に乗せて発信します。音声などをデータに変える作業をエンコードと、逆をデコードと呼び、これらを合わせてコーデックといいます。

 今回紹介するEVSは、音声コーデックのひとつです。その名称は「拡張された音声サービス」を意味する英語「Enhanced Voice Services」から来ています。

 高速に通信できる環境でもそうでない環境でも対応でき、なおかつ、高速通信が可能な状態であれば非常に高音質になるという特徴を持つコーデックです。

 携帯電話の規格標準化などを行う3GPP標準のひとつで、日本では、NTTドコモやソフトバンクのVoLTE(HD+)がこのコーデックを採用しています。

FMラジオ相当~CD音質まで

 通常のドコモVoLTEなどが使用している音声コーデック「AMR-WB」では、サンプリングレート16kHzで帯域50Hz~7.5kHzとなります。これはAMラジオ程度の音質です。

 しかし、人間の耳が聴こえる音は、20Hz~15kHz、20kHz程度までの範囲と広く、通常のVoLTEでは高音域がまだまだのかなりの部分がカバーできていません。

 これにはさまざまな理由があるのですが、そもそもこれまでの携帯電話での通信はあまりビットレートの高い通信を前提としていなかったこと、人と人との通話用途のみに使う前提であったことが挙げられます。

 EVSは、この発想から転換し、設定可能なビットレートを5.9~128kbpsと非常に広く取ることにしました。

 そして、携帯電話の通信速度によって、エンコーダーの内部処理を切り替えることで、状況に応じて高音質な音をやりとりできることとしました。

 具体的には、低ビットレート動作モードでは、元の音を聞き分けて、それが人の音声であった場合にはフレームごとに音声を効率よく圧縮する「時間領域符号化モード」に、音楽であると判断したときには音楽も効率よく圧縮する「周波数領域TCXエンコードモード」に切り替わります。

 ちなみに、TCX(変換符号化励振:Transform Coded Excitation)とは、まず、入力信号の線形予測フィルターから導出された知覚フィルターで、音データを知覚的に重み付け、続けてベクトル量子化(VQ:Vector Quantization)法で符号化するという、符号化を二重に組み合わせたような手法です。

 高いビットレートで通信できる場合は、送る音のデータは全て周波数領域エンコーダーモードを利用します。これは、オーディオ向けのエンコードですが、音声のみに対しても問題なく使えるためそのまま使用されます。これによって、EVSでは、50Hz~15kHzという音声帯域を表現できるようになりました。

 なおかつサンプリング周波数は、従来の電話で利用されてきた狭帯域音声(サンプリング周波数8kHz)から、AM/FMラジオ並みの広帯域・超広帯域音声、さらには音楽CD並みの48kHzまで対応しています。さすがにハイレゾとまではいかないまでも、(高速な通信さえ可能であれば)現代のデジタル化された音楽データが再現可能になります。

 ドコモのVoLTE(HD+)の場合であれば、最高サンプリング周波数は32kHzとし「FMラジオ並み」の音質で、しかも「音声だけでなく、音楽も高音質」な伝達が可能となりました。

大和 哲

1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら
(イラスト : 高橋哲史)