|
|
|
第168回:AAC とは
|
|
|
|
大和 哲 1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら。 (イラスト : 高橋哲史) |
|
|
FOMA「900i」シリーズではAACを音声コーデックとして採用したiモーションを、「着モーション」として着信時に再生できる
|
「AAC」は、FOMAの2102Vシリーズ、および900iシリーズで利用可能な「iモーション」の音声圧縮などに使われている音声コーデックです。現在では、デジタルBS放送の音声にも使われ、携帯オーディオプレーヤーでも多くの機種が対応しているなど、現在では、ATRAC3などと同様に、MP3に次いでよく使われ、一般に知られているコーデックであると言っても良いでしょう。また、パソコン用として「QuickTime 6.5」など数多くの圧縮・再生ソフトが提供されています。
AACは、「Advanced Audio Coding(先進的なオーディオ圧縮)」の略で、正式には「MPEG-2 AAC」と呼ばれます。1997年4月にISO 13818-7として、正式に世界標準規格となった、その名の通り、MPEG-2の新しい音声圧縮方式です。現在はMPEG-2だけでなく、MPEG-4の音声データ圧縮方式としても採用されています。
特長としては、MPEG-1の音声圧縮(MP3)と比べた場合、MP3よりも複雑な圧縮方法が採用されており、特に128kbps未満の比較的低いビットレートでは、圧縮した場合、同レベルのビットレートで圧縮したMP3と比べて再生時に音がひずみにくくなるという点が挙げられます。ただし、MP3エンコーダー、そしてAACエンコーダーは、実際の製品においてそれぞれ圧縮時に音が聞きやすくなるよう、さまざまな工夫が凝らされているため、必ずしもMP3の音声がAACに比べて聞きにくくなるとは限らないようです。
また、AACは、多チャンネル音声にも対応できることも特長の1つで、6チャンネル(5.1チャンネル)サラウンド環境にも使われます。MP3は2チャンネルステレオまでしか対応していませんが、AACは最大で48チャンネルの音声にも対応しているのです。
■ AACの仕組み
|
アップルのポータブル音楽プレーヤー「iPod mini」もAACを再生可能
|
AACの音声データを圧縮するための基本的な方針は、MP3に近いものになっています。つまり、「人間の耳に聞こえにくい部分を省く」という考え方で、さらに「この音が来たから次はこんな音」と予測できる部分をデータで簡潔に表現することで、データの冗長性を省くというものです。
人間の耳に聞こえにくくなる現象としては、たとえば、「マスキング」などが挙げられます。「マスキング」とは音が音が重なり合うときに、音がかき消されるということです。たとえばプラットホームで普通に話をしていても,電車がはいってくると電車の大きな音にかき消されて、話が聞こえにくくなるという現象は、まさに「マスキング」によるものです。
かき消されてしまって人間に聞こえない音は、データとして記録してしまうのをやめてしまえば、その分データを簡単に表現することができます。
また、音の予測に関してですが、MP3でもAACでも、同一チャンネル内予測という技術が採用されています。これは、時間で見て「この音が来たから次はこんな音」と予測できる部分のデータを減らすというもので、MP3では、音を32個の周波数帯域に分割し、帯域ごとにデータを符号化する「サブバンド方式」を採用しています。
一方のAACでは、「2048サンプルMDCT変換方式」という方式を採用しています。これは、細かく音をとっていき、それぞれ近い音の成分をDCT(離散コサイン変換)という計算を行なって、近い音の成分が極端に違わないようにすることで、音楽に妙な金属音が混じるというような音質の劣化を避けられるようにしています。
しかし、圧縮のアルゴリズムが従来のコーデックと比較して、より複雑な計算となるため、同じデータを効率よく、なめらかな音で圧縮できるものの、圧縮展開に要する計算時間やマシンパワーが必要となっています。
■ 関連記事
・ 新FOMA「900i」、Flashや着モーションなど新サービスに対応
・ アップル、3GPP2をサポートしたQuickTime 6.5製品説明会を開催
(大和 哲)
2004/02/25 12:22
|
|
|
|
|