|
|
|
第23回:MPEG-4とは
|
|
|
|
大和 哲 1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら。 (イラスト : 高橋哲史) |
|
■ MPEG-4とは
|
NTTドコモが11月29日に発表したPHS映像配信サービス端末『eggy』。動画フォーマットにはMPEG-4が採用された
|
12月8日からNTTドコモが映像配信サービス「M-stage visual(エムステージ・ビジュアル)」をスタートします。このM-stage visualは、PHSと同社のネット接続サービス「mopera」を利用して、映像を端末に配信するサービスです。このサービスでの動画データは「MPEG-4」という規格に沿ったものが使われます。
MPEG-4は、主にインターネットでのストリーミング、マルチメディアソフトウエア、そして携帯電話などの移動体通信などで使われることを視野に入れた動画像のデジタル符号化規格です。このMPEG-4は、小さなサイズの動画像にも利用できますし、また多少回線状況が悪くてもなめらかに見られるようにできていますので、移動体通信への配信のようなデータ転送速度の遅い、回線状況の変わりやすい環境でも差しさわりなく映像を楽しむことができるのです。
このMPEG-4は他にも、インターネットストリーミング用として、パソコンのWindowsのWindows Media Encoderでの標準フォーマット(ASF形式)の形式のひとつなどとしても、また、QuickTimeなどでも利用されています。
次の項では、MPEG規格について解説していますが、MPEG-4の特長や仕組みがわかればよい、という場合は、次項をとばして「MPEG4の特長」から読んでいただいてもかまいません。
■ そもそもMPEGとは
そもそも、MPEGとは「Moving Picture Expert Group (動画の専門家団体)」というISO(国際標準化機構)の中のグループの名称の頭文字を取ったものです。この組織はマルチメディア符号化を行なっているワーキンググループなのですが、転じて「MPEG」という名前が、この組織が作成したマルチメディア関連の標準規格の名前として使われています。
このMPEGでは、動画映像の信号をどのようにデジタルデータにするのか、また、音声信号をどのようにデジタルデータにするか、また、この両者をどのようにまとめて扱うか、などの規格が定められています。
たとえば、本連載の18回で取り上げた「MP3」という規格は、このMPEGで作られた規格のひとつで、「MPEG-1/Audio Layer3」といい、つまりMPEGの最初に作られたカテゴリ「MPEG-1」のオーディオに関する規格のひとつです。
そして、MPEGは映像のデジタル符号化に関するワーキンググループですので、動画像の符号化規格として、特に有名です。
携帯電話の内部に組み込まれているマイクロコンピュータや、インターネットに接続されているPCも、画像をデジタルデータとして扱っています。デジタルのデータですから、コンピュータで扱うこと自体はそれほど難しくないのですが、そのままの形でデジタルデータを通信に使ったり、ディスクに入れたりするといろいろと不都合があります。特に、データの大きさという意味では、1つ1つのコマをそのままコンピュータ内部で扱う形式で記録してしまうと非常に大きなものとなってしまい、わずかな時間分の動画しか記録できなくなってしまいます。また、各機器やコンピュータによって画像を扱うのハードウエアの設計が違いますので、そのままデータをほかのマシンでそのまま使うことはできないのです。
そのため、映像をどのようにデジタル化するのか、画像をどのようなピクセル数の画像にするかや、データの格納方法、それにその規格がどのようなデータ転送速度の機械に使えるかを「MPEG-1」や「MPEG-2」などの規格で定めています。
このMPEGには、現在では以下の4つのフェイズがあって、現在までにMPEG-1~MPEG-4までが公式な規格として制定されています。
【MPEG各種規格一覧】
| 用途 | ビットレートの目安 |
MPEG-1 | VideoCD | 384kbps ~4Mbps |
MPEG-2 | DVD、デジタルハイビジョン・地上波デジタル放送 | 1Mbps ~100Mbps |
MPEG-4 |
マルチメディアソフト、移動体通信、インターネット、 | ~10Mbps |
MPEG-7 | EPG(Electronic Program Guide・電子番組ガイド)、 ホームサーバー |
|
MPEG-1はCD-ROMにビデオ映像を収めようという規格です。動画を再生するために必要なデータ伝送能力のことを「ビットレート」と呼ぶのですが、MPEG-1では、符号化ビットレートの目安は384kbps~4Mbps程度。実際にアジア諸国などでよく販売されているVideoCDではこのMPEG-1が使われていて、コンパクトディスク内に320×240ピクセル・1秒間に約30フレームで動画像が記録されています。
続いてのMPEG-2は放送用のレベルの高い画質・音質をターゲットとした規格です。ビットレートは1Mbps~100MbpsとMPEG-1と比較してもかなり大きい数値が要求されます。規格的には最低352×288ピクセル・30フレーム/秒から最高1920×1080ピクセル・30フレーム秒という非常に精細な画像の記録に使うことができます。DVDビデオはこのMPEG-2で映像データを720x480ピクセル・約30フレーム/秒(NTSCの場合)でデジタル化して記録しています。
■ MPEG-4の特長
MPEG-4は先に述べたように、マルチメディアやインターネット、移動体通信も視野に入れた規格で、これまでのMPEG-1、MPEG-2とは異なる考えで作られた規格です。というのも、MPEG-4が応用範囲として含んだインターネットや移動体通信では、これまでのMPEGが想定したCD-ROMやDVDと比較して、データの読み書きにいくつもの制約があるからです。
まず第1に、通信はCD-ROMなどのストレージメディアと比較してデータの転送速度が遅い、ということがあります。MPEG-1が使われているVideoCDの場合、「標準速」と呼ばれる一番遅いものでも1.2Mbps(≒1200kbps =150KB/秒)のスピードでデータを転送できます。対して、たとえば現在の移動体通信の中でも比較的スピードの速いPHSでも64kbps程度ですから、数十分の一のスピードでしかデータを転送できません。
そこで、MPEG-4ではそれまでのMPEG-1、MPEG-2では考えられなかった小さなサイズの映像も扱うことができるようになりました。MPEG-4では、80×60ピクセルサイズからの動画を扱うことができます。比較すると、たとえばVideoCDの映像サイズは352×240ピクセルですから、これの16分の1以下の大きさの映像が扱えるのです。
また、MPEG-4では、1コマ1コマ(フレーム)の間隔を開けることもできます。1秒間に表示するコマ数が少なくなればなるほど必要なデータは小さくなるのです。たとえば、家庭のテレビでは、普通1秒間の映像に30枚の画像が表示されています(30フレーム/秒)ですが、MPEG-4では、規格上これを秒間1フレームにまで落とすことができます。
第2に、通信では必ず期待した速度でデータが転送されるとは限らない、ということがあります。動画は動いていますから、データが規則正しく時間ごとに正しいデータが送られてくるのが理想です。が、電波を使っている、まして移動している携帯電話などや、あるいはインターネットでは、経路の状態によっては会話で使っていて音が途切れることがあることからもわかるようにデータが途中で、途切れてしまうこともあり得ますし、エラーも発生しやすいわけです。
そこで、このMPEG-4は、画質に関してとにかくよい画質を求めるのではなく、「よい画質に越したことはないが、悪くてもある程度割り切る」という発想で作られています。
たとえば、データに途切れがあったり、エラーがあったりしたときです。MPEG-1やMPEG-2ではもし、送られてきたデータに異常があった場合は、それをCRCやリードソロモン符号などを使って「周りのデータから計算して、できるだけ正確に元のデータに戻す」ようにしています。
これは画像データ中にエラーが少ない場合はこれでほとんどの場合は画像を修正できますが、MPEG-4が使われる移動体通信などでは、回線状態によってはエラーが多すぎ修正しきれない場合もありえます。そのような場合、従来の方式ですと違和感のある画面になってしまいますので、MPEG-4では、データが途切れたときにも「見た(聞いた)感じでは、それほど違和感を感じない」ような工夫をしているのです。
たとえば、フレーム中で再現できないとわかったデータがある場合、たとえば、単純に前後のフレームで同じ場所のブロックをコピーして使ってしまったり、あるいはARTSというプロファイルでは、受け側から送り側へエラーが発生したことを伝えて、送り側が画像を荒くして送るように変更したり、ということを行なっています。
|
右上写真の赤い部分がデータの再現できなかった部分だと思ってほしい。この部分を前のフレームの同じ位置のブロックをコピーしてくると、右下の図のようにできる。船の一部が海になったり、多少おかしな部分もあるが、だいたいはそれらしい画像になる
|
■ MPEG-4のデータ圧縮方法
ここで、そもそも動画データをどうして小さく圧縮できるのか、その仕組みをお話しましょう。先ほども述べたように、画像データをそのままディスクに置いたり、通信に使うとデータのサイズが大きくなりすぎてしまいます。それならば、データの冗長な部分を削ってデータを小さくして扱おう、というのがデータ圧縮の基本です。
もともと、画像データは冗長です。「画像フォーマット」の回でも解説したように、たとえばJPEGなどでは、DCT(離散コサイン変換)などの方法で1枚の画像の中の画像中の似たような部分のデータを丸めています。MPEGもひとつのフレーム内のデータはDCTによる圧縮を利用しています。
これは難しくいうと「空間領域の冗長性の除去」なのですが、さらに動画では「時間領域でも冗長性を除くことができます。動画というのは、その動きを作る画像の一コマヒトコマが時間ごとに順番に表示されることで動いて見えます。アニメーションやパラパラアニメが何枚もの絵を順番に見せることで絵が動いて見えるのと全く同じです。
このように動いて見える動画ですが、あるコマの前後のコマの絵の内容を考えてみてください。動きのある画像が動画なわけですが、画面中を同じ物体が動いているとすると、そのタイミングの前後の絵も、その画像にとてもよく似た画像であることが多いはずです。その動いた部分以外(たとえば背景など)は元の絵そのまま、あるいは元の絵が全体にずれただけ、というパターンも多いことでしょう。
そこで、MPEGビデオデータでは、まず、基準になるフレームがあり、その前後は基準フレームからどこが違うのかを予測し、その予測データとの差分をデータにしています。こうすれば、フレームひとつひとつの画像データを全て記録しておくよりも必要なデータは遥かに少なくなるからです。
|
MPEGビデオ圧縮では、基準になるフレームを決めて、前後のフレームの似た部分、動きが予測できる部分などのデータは省くことでデータ量を小さくしている
|
MPEG-4ではさらに、複数ビデオオブジェクトプレーンで符号化の方法を領域ごとに使い分けることができるようになったり、CGなどの別に作った要素の画面への組み込み、8×8ブロック動き補償が可能となるなど、データをさらに小さくするための工夫がなされています。
また、MPEG-4の音声データでは、これまでも使われていた周波数分割方式AAC(Advanced Audio Coding)に加えて、人の声などを少ないデータで記録できるようにできるコーデックCELP(Code Exited Linear Prediction)、パラメトリック符号化など複数の符号化方法の中から利用することができるようになっています。
■ URL
maxell CyberDiskの「MPEG4」のページ
http://www.maxell.co.jp/cyberdisk/topics/9905.html
PIONEER R&D MPEG技術解説
http://www.pioneer.co.jp/crdl/tech/mpeg/1.html
(大和 哲)
2000/12/06 00:00
|
|
|
|
|