離散コサイン変換 【DCT】 Discrete Cosine Transform

概要

離散コサイン変換(DCT)とは、離散的な信号列を、様々な周波数や振幅を持つ余弦関数(コサイン)の組み合わせに変換すること。信号成分のを周波数成分のに変換する信号変換の一種で、データ圧縮に多用される。

画像や音声などをコンピュータで扱うには、対象を表すアナログ信号を一定の間隔で標本化サンプリング)し、一定幅の飛び飛びのを取る離散値に量子化する。これにより、離散値が一列に並んだデータが得られる。

このは変換前のアナログ信号の内容を反映して、連続的に変化する量(光や音の変化)を表していると考えられ、周期的に上下する三角関数の組み合わせで近似することができる。与えられたが、どのような振幅や周波数を持つ余弦(cos)の合成によって表現できるかを明らかにするのが離散コサイン変換である。

数学的には離散フーリエ変換(DFT:Discrete Fourier Transform)から派生した手法で、変換後の信号の周波数成分が低周波数領域に集中する特徴がある。データ圧縮に利用する場合は情報が少ない領域に対して少ない符号化ビットを割り当てるか、または0で近似し切り捨てることで、データの容量を減らすことができる。

この手法はJPEGMPEGMP3AACといった画像や映像、音声の非可逆圧縮(元のデータの損失を許容する代わりに高い圧縮率を得る方式)で広く用いられている。視覚や聴覚など人間の感覚器官は高周波領域の変化に鈍感な特性があるため、離散コサイン変換後の高周波成分を思い切って省略することにより、人間にはほとんど違いが分からないくらい品質を保ちながら劇的にデータを減らすことができるためである。

離散コサイン変換には主な手法が8つあり、そのうちの4つが一般的に使われる。音声圧縮の場合は対象領域の境界でノイズが生じないよう、領域を重複させながら半分ずつずらして計算していく「修正離散コサイン変換」(MDCT:Modified DCT)がよく用いられる。離散コサイン変換の逆変換(周波数成分のから元の信号列を得る)を「逆離散コサイン変換」(iDCT:inverse DCT)という。

(2020.5.26更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる