DVD VIDEO 規格概要
〜MPEG 応用ハード先駆者の素顔(^_^;〜



 言わずとしれた DVD VIDEO。近年ではレンタルも開始されていますし、DVD レコーダと言えば人気商品の花形です。そして、ソフト売り場でもついに LD を端へ追いやり、ついにメインの位置を確保してしまいました。

 先日、掲示板にて DVD VIDEO の映像方式とともに、音声方式が複数あるようでわかりづらい、というリクエストを受けましたのでさっそく、解説を制作してみました。

 私自身、DVD プレーヤーを買ったのは高々、数年前の夏のことです(^_^;)。それもたった一つだけの、欲しいソフトがどうしても LD 化されないのに業を煮やして、という理由で仕方なくだったのですヽ(´ー`)ノ。

 それには、画質その他諸々の理由があるのですが、ここでは DVD VIDEO の正体と真実に迫ってみたいと思います。ちなみに、DVD に関する詳細な規格等は、パイオニアのサイトにありますので必要な方は、参照されると良いと思います。




  DVD VIDEO の仕様

 まずは DVD VIDEO の仕様表からです(^_^;)。みなさんもご存知かと思いますが、DVD とは Digital Versatile Disk のことで、直訳するとデジタル多用途ディスクと言ったところでしょうか。その中の一つが、DVD VIDEO となります。


DVD VIDEO(NTSC) の仕様
ディスク径・厚等 12cm(CD と同じ)・0.6mmX2(二枚張合せ)

※片面一層、二層及び両面一層、二層という種類がある
(二層は表に半反射膜、深層に通常の反射膜を用いる)

トラックピッチ 0.74μm・最短ピット長 0.4μm
セクター配置 CLV・変調方式 8-16 ビット変調
誤り訂正 RS-PC 方式・使用レーザー 650/635nm

記録容量 片面一層 4.7GB・二層 8.5GB
     両面一層 9.4GB・二層 17GB
記録時間等 全合計平均記録レート 4.692Mbps として、約133分
※片面一層あたり喚算
映像記録方式及び
コーデック
720x480 画素・29.97 フレーム/秒(2:1 インターレース)
コンポーネントデジタル(4:2:0)
MPEG-2 MP@ML 符号化・約 1/40 圧縮(適応可変レート)

※ビデオ部分の最大ビットレート 9.8Mbps
※動きベクトル符号化で約 1/2
 DCT(離散コサイン変換)で 約 1/10
 可変長符号化で(ハフマン符号)約 1/2 の合計
※16:9 横方向圧縮モードあり(スクイーズ)
※マルチアングル及びマルチストーリーが標準オプション
音声記録方式等 PCM 直線 16/20/24bit(最大)量子化・96KHz もしくは 48KHz標本化(32/44.1KHz 含む)
もしくは、DOLBY AC-3 5.1ch デジタルサラウンド

※オプションで DTS/MPEG オーディオに対応可
※最大 8 言語対応
※最大字幕 32 言語対応
※DOLBY 5.1ch は、20〜20KHz の帯域を持つ
L・C・R/リア L・R に加えて重低音用の 120Hz 以下
専用 ch を追加したもの。
その他 現在流通するものには、CD と同様のプラケースと縦長の映画に多く見られるケース(※トールケース)との2種類が流通している。
※個人的には CD 様ケースの方がディスクの取り出し易さや、保管に困らないので助かる
(トールケースの名称を知っていたら、マニアかもしれません[ボカスカ])

※最近、DVD-Video フォーマットに音声+静止画を記録した DVD-Video MUSIC なるものが登場したようですが、そもそも DVD-Audio の規格をわけ、DVD-Video プレイヤーで再生できなくしたのかが、解りません。バカとしか思えませんが(^_^;)。



  MPEG-2 コーデックの特長など

 同じ MPEG でも、MPEG-1 に関しては 90 年代はじめから CD-I や VIDEO CD で実用化していました。また当時から乱立していたパソコン上で扱われる動画規格の中でも、比較的高画質(当時の PC 上では)なフォーマットとして知られたところだと思います。

 ただし画素数が、352x240 もしくは 320x240 が標準であること、比較的低ビットレートでしかも固定レートのみ、等の点から画質的には VHS 程度にとどまっていました(S/N と色再現性はずっといい)。しかし DVD では、更に高画質(スペックだけでは LD を上回る)な、720x480 画素としています。

 さらに固定ビットレートでは、常に変化のある動画像圧縮では効率が悪かったのですが、動きの少ない画像や静止画等、符号化のやさしい画像ではビットレートを下げ、逆に高精細な画像や動きの激しい画像では、ビットレートを上げるといった可変速符号化が採用されています。

 そのため DVD の GOP(次章参照)単位のデータレートを見てみると、1〜10Mbps 程度の範囲で変化していることがわかります。固定レートでは、8〜9Mbps でも画質的にまだ不十分な場合がありました。固定レートで高画質を保つには、常に最高レートで符号化せねばならず、とても非効率的です。

 しかし可変レートによって、平均で 3.5Mbps 程度(画像のみ)でありながら高画質と符号化効率を両立しています。実際は画質をさらに良好に保ち、画像の破綻を防ぐためもっと高いレートが設定されており、映画ソフトではほとんどが片面二層ディスクを採用しています。
 また、プロモーションビデオ等のビデオクリップでは比較的時間が短いため、平均ビットレートは 7-8Mbps 前後くとられているようでこの手のものは、特に画質が高いのが特徴です。

 またハイビジョンへの適用を考慮して、MPEG-2 より更に高画質な MPEG-3 というものも検討されていましたが、MPEG-2 に高画素数・高ビットレートな HDTV(ハイビジョン)を含めることになり、MPEG-3 は欠番となっています。

 なおデジタル BS やデジタル CS などのデジタル放送では、同じ MPEG-2 でも固定レートとなっています(伝送路の特性による)。




  動画像圧縮の基本について

 まずは図をご覧頂くとして、左側がフレーム 1、右側がフレーム 2 とします。ちょうど、車が画面の奥から手前に向かって、走ってくるイメージです。

 まず、1 フレーム目の画像全体を DCT により、圧縮します。これを基本(参照画像という)として、次フレーム以降の符号化に活用します。

 単純に考えて、一フレームずつ単純に DCT 圧縮を施したのでは、デジカメによる静止画が何枚も続くようなものなので、フレーム数が膨大になる動画像では、あまり圧縮率を上げることはできません。
 そこで MPEG 系など、いわゆるハイブリッド符号化で特徴的な、画像の動きによる差分の符号化が必要になってきます。

 前出の左右の画を比較すると、違っているのは(動きがある)赤丸印を付けた、車の部分だけです。ですから、その他背景などの部分については、左側基準フレームの画像データだけで再現でき、再度データ化する必要はなくなります。
 そして動きがある部分についても、既に圧縮・データ化されていますので、それを基に動きの方向と大きさのみをベクトルとして、データ化します。こうすることで既に圧縮・データ化された画像を、ある程度次のフレーム以降にも活用できるわけです。
 これは隣り合ったフレーム同士が、似通っていることを利用しています。

 しかし、例えば図のような動きでは、次第に車が手前に迫ってくるのですから、徐々に細部が見えてくることになり、データが足りない部分が出て来ます。その場合はデータが足りない箇所のみ、再度画像を DCT 圧縮します。平たくいえば、ちょうどデジカメでその部分だけを、撮影するようなイメージです。
 また、この”足りない部分“が大幅にあると、目立つ劣化となってしまいます(いわゆるブロックノイズ等)。

 こういった複数の手順により、基準となるフレームで圧縮・データ化された情報を、他のフレームでも積極的に活用することで、大きな圧縮率を実現しています。(単純に画像を間引いていくと、ボケたりモザイク状になっていくだけである)。

 また言い換えれば、アニメやパラパラマンガの原理に近いものがあります。動かない静止画を、動画として見せるには少しずつ、違った画を何枚も描く必要があるのは、ご存知の方も多いかと思います。

 その一枚一枚の、”違い“に着目して処理することこそが、ハイブリッド符号化ににおける動画像圧縮のミソです。アニメでも、一枚の同じ画を少しずつずらして撮影したりすることで、物体の移動等を表現することがあります。
 ましてや、背景画は場面が変わらない限り、しばらく同じ画が使われますが、これも圧縮の概念に近いものがあります。


 またこれらの基本概念は、MPEG-1・2 から最新の MPEG-4 や H.264/AVC 等に至るまで、ハイブリッド符号化に共通する原理です。




  GOP(Group of pictue)について

 MPEG で特徴的な、GOP について簡単に述べておきます。前章とあわせておさえることで、動画像圧縮についての理解が、より深まるかと思います。

ピクチャータイプ 内容など
I ピクチャー Intra Picture
前後のピクチャーとは独立していて、画面全てを DCT にてフレーム内符号化する
P ピクチャー Predictive Picture
I ピクチャーを元に、順方向の予測符号化をする
B ピクチャー Bidirectionally Picture
I ピクチャー、P ピクチャーを処理した後、双方向予測により符号化する

 I ピクチャーは全ての基本となるフレームで、頭出しやその他のピクチャーを処理するのに必須となります。次に P ピクチャーは I ピクチャーを元に、順方向予測で符号化されますが I ピクチャーと比較して、符号量が少なくなります。

 更に B ピクチャーは双方向予測で符号化されるため、P ピクチャーと比較してより少ない符号量で済むことになります。これらのピクチャータイプを組み合わせることで、動画像をより効率よく圧縮する事ができます。また下図に GOP 構造の例を示しておきます。





  比較的目立ちやすい DVD の動画像劣化
   〜MPEG-2 による動画像劣化の具体例〜

 ここでは「デジタル BS 放送の実際」、という記事と一部重複しますが、極めて重要なので本章を加筆、転載しておきます。

 MPEG による動画像圧縮では、DVC と違い時間軸方向(順方向と双方向フレーム間相関による動きベクトルを検出、符号化)にも相関をとり、圧縮をかけます。そのため細かい絵柄での、激しい動き、激しい輝度変化(又はシーンチェンジ)、等に弱いと言えます。

 また劣化を解説する上で、非常に有名なブロックノイズとは、符号化の際に 8x8 画素などで行われる、処理単位(ブロック)の形状が現れるノイズです。具体的には、画像劣化した部分がモザイク状になります。
 さらにモスキートノイズとはまるで蚊が飛び交っているような、もやもやしたノイズのことです。これは、JPEG 画像の圧縮率をあげたり、単に画像を拡大するだけでも容易に確認できますが、これと似た性質のものです。

 このように MPEG 系のコーデックでは、静止画以上に絵柄による符号化の優しいものと、難しいものとの差がどうしてもでてきます(符号化の難易度という)。

 極端な場合最終的には、BS デジタル放送の様に画像が、全体的にブロックノイズだらけに・・・。さらに悪化すると、これ自体が 8 色(お馴染みデジタル RGB と同じ組み合わせ(^_^;)ベタ塗りの市松模様だらけに・・・、と破綻することになります。(誠に勝手ながら、これを圧縮動画像の終局崩壊と呼びます<ボカスカ)

 さすがに DVD では、約 1/40 という圧縮率と可変レートであることを考慮すると、ベタ塗り市松模様の劣化は出ないと思います。

  ※ベタ塗り市松模様は解りづらいと思うので、グラフィック系ソフトの
   カラーパレットみたいな感じ、と付け加えておきます。BS デジタル
   ハイビジョンでは、最悪の場合本当にこの劣化が出ます(笑)。

 下記に実際の MPEG-2 動画像で起きた、劣化画像例を示します。

実際の劣化画像例
ブロックノイズ モスキートノイズ(拡大)

 ついでに実際に発売されている DVD ソフトで、具体的に動画像劣化の解りやすいソフトがありますので、ここにご紹介します。”モーニング娘。“のビデオクリップ集「映像 ザ・モーニング娘。ベスト 10」中の、一曲目がお勧めです。

 まず初期のメンバーが、花園をバックにして歌うシーンがあるのですが、背景の揺れる花や草の間に、モスキートノイズを見ることができます(スローにするとわかりやすくなります<超ボカスカ)。

 さらに、急速なフェードイン・フェードアウトがあるのですが、よく見ているとそのときにも盛大にモスキートノイズが出ているのが解ります。

 スローでないと厳しいですがなかには、ブロックノイズがはっきりと確認できるフレームもありますから、画質に厳しい映像マニア御用達?と言っても過言ではないでしょう(動体視力が良ければ、通常再生でも解る)。これ一枚で自然画による、動画像圧縮画質評価が存分にできます(^_^;)。

 また、シーンの変わり目でスローやコマ送りをしていると、「おやっ!?」と思うようなものすごい劣化ノイズに出くわすので、ヘタなテスト用ディスクを買うより、おもしろいかもしれません。

 でも、モー娘。ファンの方々、くれぐれも気を悪くなさらないでください。よっすぃーが大好きだったりします(ボカスカ)。もちろん、このソフト以外でもよく見ていると大きな劣化の出ているソフトがあります。
 たった 1 フレーム単位でも、大きい劣化では目立ってしまうものです。ただ、映画ソフトでは目立った劣化にお目にかかっていないので、いかににオーサリングが大切かがわかります。

 それから、DVD ソフト全体ではやはりミュージッククリップ、しかも曲数の少ないものが画質的には有利なようです(平均レートが高くとれるせい)。もちろんオーサリングの質にも左右されますが、宇多田ヒカルの「Wait&see〜リスク〜」(DVD シングル版)は、極めて高画質です。

 SFX の出来もさることながら、画質自体も非常に良好です。収録は 35mm フィルムですが、テレシネ、合成・編集等のポスプロに至っても、非常にお金がかかっておりそのため、上質なものができていると感じますが、いかがでしょう。

 このソフトでは、動きの早いシーンや薄暗いシーンが多くあり、これが S/N 比や階調表現などの評価に使えると思います。また、宇多田くんがアップになるシーンでは、髪の毛の映り具合で解像度が(^_^;、肌や唇などの色でカラーバランスがわかります(ボカスカ)。

 「モーニング娘。映像ザ・ベスト 10」とは対照的に、画質的評価用のリファレンスとして、お勧めのディスクです。しかも、値段が \1.5K と手頃なのがありがたい限り・・・。ちなみに、モー娘。の新しいシングル・ビデオクリップ集、「映像・ザ・モーニング娘。2」のオーサリングは極めてマトモでした。

 そういえば昔、パイオニア LDC から「WATCHING PEOPLE」という、自然画のみのテストディスクがでていました(なんと元 YMO の細野さんやきたろうさんが出演)。テストパターンだけでなく、こういった見て楽しめるテストディスク、DVD でも出してくれませんかね〜。

 また最近では、各種 DVD レコーダーが市場をにぎわせていますが、2 パス(ものによっては 3〜5 パス)でじっくり時間と手間をかけてエンコードする市販 DVD パッケージソフトと、民生用のリアルタイムエンコーダーの比較をするのは、間違っていると思います(DVD ソフト製作用のエンコーダは、基板だけで \1M 以上します)。
 それに付け加えると、画像劣化による破綻を防ぐために、シーンチェンジ等で適宜強制的に I ピクチャ(キーフレームともいう)を挿入したり、とものすごく神経を使います。

 更に余談になり申し訳ないですが、二層ディスクではレイヤージャンプと言って、層の切り替わるポイントにも雰囲気を損なわないよう、細心の注意を払うのです。
 LD の A/B 面反転ほどは途切れませんが、プレーヤによっては 0.5〜1 秒弱程度画面がフリーズしたり、途切れることがあるためです。

 このことは、二層ディスクのパッケージには必ず、注意書きがあります。もしも、二層 DVD-R/+R で自作ディスクを製作する際は、このことにも留意すると更に良い物ができるでしょう(ボカスカ)。




  16:9 スクイーズ収録と長編映画について

 しかしこんな DVD にも、良いところはあります(^_^;)。極端な劣化を抜きにすれば、16:9 スクイーズ収録による映画などでは、ワイドモニタにて垂直解像度を劣化させずに、フル画面で作品を楽しむことができます(モニタ側で電気的に横方向を引き延ばす)。

 LD 等のレターボックス収録では、ワイド化した際にズームすることになり、走査線のあらが非常に目立つので、このことは重要と言えましょう。はっきりいって、525 以下のズームなど見られたものではありません(^_^;)。

 左図が、スクイーズ収録のイメージです。この場合、映像自体は横方向を圧縮し、4:3 で記録、再生時に変換処理をして、16:9 ではモニタ側で横方向に伸張、4:3 ではレターボックス変換を経て表示、という具合です。

 このほか、パンスキャンと言い 16:9 の中心部をとり左右を切り捨てた、4:3 モードも選択可能です。

 ここでまた蛇足になりますが、ソニー WEGA 等に搭載されている DRC やら、各社のプログレッシブスキャンテレビの、画質の悪さにははなはだうんざりしています(ハイビジョンテレビを含む)。
 CRT で、偏向回路を簡略化するため(広範囲の映像周波数に対応しなくて良いから)というのが発端のようですが、インターレースの NTSC は変換せずにそのまま見た方が、きれいなのは当然です。

 このようなへんてこなテレビは、総じて若干ぼやけた感じのする、フォーカスの甘い画になります。また放送・業務用モニタみたいに、4:3 CRT でもオリジナル走査線数で、 16:9 を再現するモードを民生用にも、積極的に採用してほしいものですね(ソニーの 4:3 WEGA に一部あるが CRT がろくでもない)。

 話がそれたので本題に戻ります。かつて LD で問題になった長編映画のディスク掛け替えも、DVD なら二層ディスクにより、解決です(^_^;)。たとえば、あの名作「タイタニック」は 3 時間 20 分近い尺ですが、片面二層ディスクのおかげで、途中層切り替えの際に 1 秒程度画面がフリーズまたは、途切れるだけで映画が楽しめます。

 従来、レーザーディスクでは長時間ディスクの CLV でも、片面に 60 分しか入りませんでしたから、どんな映画でも必ず途中で 10 秒程度も(A/B 面自動反転)、途切れていたわけです。それに比較すると、非常にスマートかつ映画の雰囲気を損ないにくい、と言えます。

 もちろん、言うまでもなくディスク自体がコンパクトですから、LP レコードと同じ大きさの LD を掛け替える煩わしさと言ったら、面倒でたまりません。LD の画質だけは、非常に素直でいいのですが私も、すっかり DVD の便利さに毒されてしまいました(ボカスカ)。

 なんとなく、アナログレコードから CD へ来たときの気持ちを、彷彿とさせる出来事でございます・・・。というわけで、ネタが尽きたのでこのあたりでひとまず終了とさせていただきます(^_^;)。




  むすびと最近の音楽・映像ソフト業界について

 私なりに DVD の規格概要と、その実態ををまとめてみました。それにしても最近、DVD プレーヤは安くなりましたね〜。ニーズ製(死語?。ニーズ=新興工業国)なら、\3K 台まで現れる始末(^_^;)。ほとんど PC用、CD/DVD のコンボドライブ並みです。
 一流メーカー製(もち海外工場製)でも、\10K 前後と言う始末(^_^;)。DVD/HDD レコーダーは SD のみのものは早々に姿を消しつつあり、ハイビジョンチューナーいり(円盤は DVD しか書けない)のものが \40-50k 台 で売られるようになってきました。

 '07 年度末、東芝・NEC 陣営が HD DVD と称する、これまたへんてこな規格をがんばって出し続けていましたが、思いのほか早期完全撤退が決まり嬉しい限りです(ボカスカ)。
 私は口を酸っぱくして、「単層で 15GB/二層で 30GB とか終ってる」と登場前から言っていたらそのおりになったので、拍手をしてしまいました。独り相撲をつづけて累損を増やすよりも、この時期の撤退は英断であると言えるでしょう。

 ようやく一本化された次世代 DVD 規格ですが、勝者の BLUE RAY は言うまでもなくこれからじわじわ、とくる規格だと思います。

 閑話休題。次は、ソフトウェア業界について・・・。


 そういえば、レコード協会や著作権団体などが P2P による音楽ファイル交換や、CD-R によるコピーをやり玉に挙げていますが、例えば 7 曲程度のビデオクリップ集が DVD では、\2-3K 台程度で買えるのに音声だけでほとんど同じ値段の CD アルバムは、素人目にもにマーケティング上圧倒的に不利です(自分で自分の首を絞めているようにしか見えないのですが・・・)。

 物価が下がり続ける中で、CD の高値安定は異常だとしか言いようがありません。少なくとも、アルバムで \2〜1.5K 以下、シングルに至っては \0.5〜0.3K 程度でないとこれからも、どんどん売れなくなると思います。
 さらに、最近はやり?の CCCD(コピーコントロール CD)はユーザーの利便性を制限するだけで、ますます CD の売り上げ減に拍車をかけ、結局はほとんど消滅・・・。音楽業界って、せっかくアーティスト側はイケてる最先端な、方々!?が多いのに会社側は、旧態依然としていて泣けてきますね〜。

 それに、公衆通信が広帯域化すれば、パッケージメディアが厳しくなるだろうことは、十数年以上前から素人の私にも予測できていたことです。まさか音楽・映像ソフトメーカーのお偉いさんは、そんな単純なことにも最近気づいたのでしょうか?。

 それとも、”真の敵“が携帯電話だということを、認めたくないからでしょうか。





記事一覧にもどる