← 記事一覧に戻る
動画の基礎知識

動画の解像度入門 — SD・HD・4K・8K、画素数が本当に買ってくれるもの

#fundamentals #resolution #4k
動画の解像度入門 — SD・HD・4K・8K、画素数が本当に買ってくれるもの

解像度は、誰もが知っている唯一の動画スペックです。カメラの箱に、テレビの棚札に、書き出しダイアログに、配信プランの比較表に——1080p、4K、8Kと、常に「上に行くほど良い」はしごとして提示されます。

そして同時に、動画で最も誤読されている数字でもあります。4Kファイルが良質な1080pファイルより悪く見えることがあります。二つのファイルがどちらも「4K」を名乗りながら、同じものを意味しないことがあります。箱に印刷された数字が表すのは容量であって、結果ではありません。解像度が実際に何を測っているのか、標準的な規格は何を意味するのか、そして画素数が本当に効くのはいつなのかを解説します。

解像度が実際に測っているもの

解像度とはピクセルグリッドのサイズ、つまり幅×高さです。1920×1080のフレームは2,073,600ピクセル——約2.1メガピクセルのグリッドです。3840×2160のフレームは8,294,400ピクセル——約8.3メガピクセルで、ちょうど4倍です。

解像度が測るのはそれだけです——フレームがいくつのサンプルに分割されているか。各サンプルの質については何も語りません。各ピクセルの品質は、エンコーダーがそのピクセルに使えたビット量(ビットレート)、色がどれだけ細かく記録されたか(ビット深度とクロマサブサンプリング)、そしてそもそもレンズとセンサーが何を届けたかで決まります。解像度とは画像の上に敷かれたサンプリンググリッド——ディテールの上限であって、ディテールそのものではありません。

写真と比較して感覚を合わせておく価値があります。8.3メガピクセルはスチルカメラなら平凡な数字ですが、動画には十分です。フィルムグレイン、モーションブラー、毎秒24枚の変化するフレーム——動画がシャープに見えるために、写真レベルの画素数は昔から必要なかったのです。

標準的な規格

名称ピクセル総画素数(約)出会う場所
SD(NTSC)720×4800.35 MPDVD、DVテープ、レガシー放送(日米)
SD(PAL)720×5760.41 MPDVD、レガシー放送(欧州)
HD / 720p1280×7200.9 MP初期のHD放送、軽量な配信
フルHD / 1080p1920×10802.1 MPBlu-ray、放送、長年のデフォルト
QHD / 1440p2560×14403.7 MPPCモニター、ゲーム——放送規格ではない
DCI 2K2048×10802.2 MPデジタルシネマ上映
UHD(「4K」)3840×21608.3 MP4Kテレビ、配信、コンシューマーカメラ
DCI 4K4096×21608.8 MPデジタルシネマカメラと上映
8K UHD7680×432033.2 MPフラッグシップカメラ、NHKの8K放送

注目すべきパターンが二つあります。第一に、大きな段差は画素数を4倍にします。UHDは1080pのちょうど4倍、8KはUHDのさらに4倍です。幅と高さを2倍にすると画素数は4倍になり、この「4倍」は解像度のあらゆる側面に付いて回ります——ビットレートにも、ストレージにも、処理コストにも。

第二に、SDの欄は奇妙に16:9でない寸法をしています。標準画質は非正方形ピクセルを使っていました——720×480のDVフレームが4:3(または16:9)で表示されるのは、各ピクセルが縦より横に広い(または狭い)からです。詳しくはアスペクト比の記事で扱っていますが、ここで重要なのは「格納上の寸法が映像の形を教えてくれる」という思い込みが崩れる点です。

「4K」が二つの意味を持つ理由

「4K」はデジタルシネマで生まれた言葉です。DCI 4Kは4096×2160——Digital Cinema Initiativesコンソーシアムによるコンテナ規格で、アスペクト比は約1.90:1。劇場フォーマットの1.85:1や2.39:1は、ここから切り出されます。

その後コンシューマーの世界がこの名前を借りたのがUHD、3840×2160です——1920×1080を縦横ちょうど2倍にし、既存のHDコンテンツが綺麗にスケールするよう16:9を維持しています。すべての「4K」テレビ、すべての「4K」配信プラン、そしてほとんどの「4K」カメラモードはUHDです。

差は幅256ピクセルだけですが、実害があります。シネマカメラは両方を搭載していることが多く(メニューの「C4K」と「4K」の区別がそれです)、DCI 4KのクリップをUHDのタイムラインに置くと、わずかに、静かに、スケールまたはクロップされます。ファイルのバッジに書かれた名前はどちらなのかを教えてくれません——実際のピクセル寸法だけが教えてくれます。

1080p・2160p・4K——命名の反転

古い規格は高さで名付けられていることに注意してください——480、720、1080。一方、4Kと8Kはおおよそので名付けられています。つまり1080pと2Kはほぼ同じもので、「2160p」と「4K」は完全に同じものです。この反転がはしごの途中で起きるため、はしごは実際より大きなジャンプに聞こえます。1080→4Kは「ほぼ4倍」に読めますが、高さで言えば1080→2160に過ぎません。

文字にも意味があります。1080pのpプログレッシブ——すべてのフレームが完全な一枚絵で、上から下へ描画されます。1080iのiインターレース——各「フレーム」が交互の走査線による二枚の半端な絵で構成される、アナログ放送から受け継いだ帯域節約の技です。二つの信号がどちらも「1080」を名乗りながら、片方がプログレッシブで片方がインターレースなら、動きの見え方は目に見えて違います。現代のカメラとインターネット全体はプログレッシブで、インターレースは主に放送チェーンとレガシーアーカイブに生き残っています。

画素数が多い ≠ シャープな映像

最も重要な誤読がこれです。解像度はディテールの上限を決めるだけで、そこにどれだけ近づけるかは他のすべてが決めます。

ピクセルには餌が必要です。 すべてのフレームはビットレート予算を持つエンコーダーを通過します。予算を上げずに画素数を4倍にすれば、エンコーダーはピクセルあたりに使えるビットを減らします——ディテールは軟調になり、動きは滲み、追加の解像度が防ぐはずだったまさにそのアーティファクトが現れます。強く圧縮された「4K」配信が、良くエンコードされた1080pのBlu-rayより悪く見えるのはこのためです。ディスクの潤沢なビットレートは2メガピクセルを適切に満たし、配信は8メガピクセルを飢えさせているのです。このトレードオフはビットレートの記事で詳しく扱っています。

ピクセルはそもそも存在しなければなりません。 甘いレンズ、ノイズの多いセンサー、外れたフォーカス、モーションブラーは、上限の下にさらに低い天井を作ります——軟調な画の4K収録は、軟調な画の大きなファイルです。4Kで記録しても、光学系が届けなかったディテールは追加されません。

シャープネスは知覚です。 「シャープ」と感じられるものの正体は、主にエッジのコントラストと微細なテクスチャの再現であって、生の画素数ではありません。パリッとした、良くグレーディングされた1080pが、フラットでノイジーな4Kよりシャープに見えることは日常的にあります。

解像度はファイルがどれだけのディテールを保持できるかを教えてくれます。実際に保持しているかどうかは、上流のすべてが決めます。

そもそも見えるのか?——視聴距離

目の分解能は有限で、ピクセルは目が分解できる視角に達して初めて意味を持ちます。変数は画面サイズと距離です。

55インチのテレビを典型的なソファ距離2.5〜3メートルで見るとき、1080pと4Kの区別は本当に困難です——追加のピクセルは目が分離できる大きさを下回っています。同じパネルを1.5メートルに近づけるか、腕の長さの27インチモニターに切り替えるか、スマホを顔から30cmで持てば、差ははっきり見えます。これが「Retina」ディスプレイの論理のすべてです。ピクセル密度は、その画面を実際に使う距離で目に勝ちさえすればよいのです。

実務的に言えば:4K納品が報われるのは、画面が視野の大きな部分を占めるとき——モニター、近くで見る大型テレビ、映画館、VR。部屋の向こうのテレビやWebページに埋め込まれた動画では、良くエンコードされた1080pと視覚的に区別できないことがよくあります。

それでも4Kで撮る理由——オーバーサンプリングと余白

1080p納品で十分なことが多いなら、なぜほぼ全員が4Kで撮るのでしょうか。収録解像度と納品解像度は別の目的に仕えるからです。収録時の追加ピクセルはワークフローの余白です。

  • リフレーミング。 1080pタイムライン上の4K素材は、画質劣化ゼロで最大2倍までパンチインできます——構図の取り直し、疑似的な2カメ目、フレーム端の邪魔者の排除。
  • スタビライズ。 ソフトウェア手ぶれ補正はクロップとシフトで動きます。余剰解像度こそが補正の切りしろです。ネイティブ1080pの補正は目に見えるシャープネスを代償にしますが、1080p納品のための4K補正はタダです。
  • オーバーサンプリング。 4Kを1080pにダウンスケールした映像は、ネイティブ1080p収録より良く見えます。ノイズは平均化され、エッジはクリーンに描画され、4:2:0で収録した4Kのクロマディテールは1080pでほぼ4:4:4相当になります——クロマサブサンプリングされた素材にとって実質的なアップグレードです。
  • 将来への備え。 アーカイブマスターは納品フォーマットより長生きします。今日4Kで撮った素材は今後何年も綺麗に再納品できます。10年前の1080pマスターは、いまやリマスターの制約要因です。

逆方向——アップスケーリング——は、収録されなかったものを取り戻せません。古典的な補間はディテールの増えない滑らかな拡大画像を作るだけで、MLアップスケーラーは本物のディテールを復元するのではなく、もっともらしいディテールを発明します。納品の仕上げには十分なことも多いですが、アーカイブにおいては正直でいる価値があります。世の中の「4K」ファイルのかなりの数はアップスケールされた1080pマスターで、メタデータはそれを白状してくれません。

ピクセルのコスト

「4倍」はすべての請求書に現れます。

  • ビットレートとストレージ。 画素数4倍がちょうど4倍のビットレートを要求するわけではありません——エンコーダーは細部の冗長性を利用するので、典型的には2〜3倍です——が、同等画質の4Kファイルは1080pの数倍のサイズになります。これこそがH.265とAV1の普及を後押しした圧力で、コーデックの記事で扱ったとおりです。H.264での4K納品はつらく、HEVCなら日常です。
  • 処理。 エンコード、デコード、デベイヤー、グレーディング、レンダリング、すべてが4倍のピクセルを相手にします。4Kをスムーズに編集するためにプロキシワークフローが存在し、8Kの編集ではそれが必須になります。
  • モードのトレードオフ。 カメラのセンサーには読み出し速度の上限があるため、解像度はフレームレートとトレードされます——4K 60fpsで撮れる同じカメラが、1080pなら240fpsで撮れたりします。収録モードを選ぶことは、そのショットに必要なディテールの種類(空間か時間か)を選ぶことです。

8Kについては冷静な注記を。納品フォーマットとしてはほぼすべての視聴環境で人間の視力を超えてしまいますが、収録フォーマットとしてはオーバーサンプリングとリフレーミングの余白をもう一段先に進めたものです——そして実際、主にそう使われています。

メタデータの中の解像度——符号化寸法と表示寸法

動画ファイルの他のすべてと同じく、解像度もメタデータに宣言されます——そして中には思った以上に多くの「寸法」があります。

Stream #0:0: Video: h264
  Width: 1920, Height: 1080
  Coded width: 1920, Coded height: 1088
  Sample Aspect Ratio: 1:1
  Display Aspect Ratio: 16:9

Coded(符号化)寸法は、コーデックが実際に処理するサイズです。H.264は16×16のマクロブロック単位で動作し、1080は16で割り切れないため、エンコーダーは1088にパディングし、クロップフラグがプレーヤーに「1080行だけ表示せよ」と伝えます。無害です——ツールが間違ったフィールドを読んで1088と報告したり、最悪の場合パディングまで表示したりするまでは。

サンプルアスペクト比(SAR)は、先ほどの非正方形ピクセルの話です。720×480で格納されたSDファイルはSAR 10:11で4:3として表示されます。格納寸法だけを読むと、ライブラリ内のすべてのSD素材について、形と実効解像度の両方を見誤ります。アナモルフィック収録は同じことをより高い解像度で行います。

つまり「このファイルの解像度は?」には本当に複数の答え——格納、符号化、表示——があり、それらを混同するツールが古典的な謎を生みます。1088行のファイル、潰れて見えるDVクリップ、プレビューで横に伸びるアナモルフィックマスター。

ライブラリの解像度タグが重要な理由

現場のライブラリが単一解像度であることはまずありません。UHDやDCI 4Kのカメラマスター、1080pのプロキシ、非正方形ピクセルのレガシーSD素材、モニター解像度そのままのスクリーン録画、縦型1080×1920のスマホクリップ——すべてが混在し、すべてが「動画」というラベルを付けています。

VideoTaggerはライブラリをインデックスする際、すべてのクリップの実際のピクセル寸法を——コーデック・ビットレート・フレームレートとともに——検索可能にします。これにより次のことが可能になります。

  • 4Kカメラマスターと1080pのプロキシ・納品物を、ファイルを開かずに一目で分離
  • UHD(3840×2160)素材に紛れたDCI 4K(4096×2160)クリップを、同一タイムラインで混ざる前に発見
  • 表示上の形が格納寸法と一致しないレガシーSD・アナモルフィック素材を洗い出し
  • 解像度とビットレートを組み合わせて実際の品質を判断——ビット不足で飢えている不審に小さな「4K」ファイルや、安価な複製で足りるストレージ食いのマスターをフラグ付け

解像度は、誰もが動画ファイルから最初に読み取る数字です。それが正しい数字であること——実際の寸法が、正しく解釈されていること——が、ライブラリの他のすべてが乗る土台になります。

まとめ

  • 解像度はピクセルグリッド——幅×高さ。ファイルが保持できるディテールの上限であり、実際に保持するかはビットレート・光学系・処理が決める
  • 規格の階段:SD(720×480/576)、720p、1080p(2.1 MP)、UHD 4K(3840×2160、8.3 MP)、DCI 4K(4096×2160)、8K(33.2 MP)——大きな段差は画素数4倍で、その4倍はビットレート・ストレージ・処理コストに付いて回る
  • 「4K」は二つの規格:DCI 4096×2160(シネマ)とUHD 3840×2160(コンシューマー全般)——タイムラインで混ぜると静かにスケールまたはクロップされる
  • 画素数が多い≠シャープ:飢えた4K配信は良くエンコードされた1080pディスクに負けうるし、ソファ距離ではそもそも差が見えないことも多い
  • 納品解像度より上で撮ることは本物の余白を買う——リフレーミング、スタビライズ、オーバーサンプリング(4K→1080pはほぼ4:4:4クロマ相当)、将来も使えるマスター。アップスケーリングはその逆を偽装することしかできない
  • ファイルには格納・符号化・表示の寸法がある(1088行のパディング、SDの非正方形ピクセル)——間違った寸法を読むことが、解像度の謎の出どころ

VideoTagger は完全無料

動画ライブラリの整理と検索が完全無料で。アカウントもクレジットカードも不要。ダウンロードして数分で始められます。

関連記事