読み方 : メルしゃくど
メル尺度【mel scale】
概要
メル尺度とは、人間の聴覚が感じる音の高さの知覚に基づいた心理的な周波数尺度。物理的な振動数としての音を、人間が主観的に知覚する音の形へと変換するための架け橋として用いられる。

人の聴覚は、低い周波数では周波数差に敏感である一方、高い周波数になるにつれて感度が相対的に低下する。メル尺度はこの特性を反映するために、1000Hzの純音の高さを1000メルと定義し、それを基準として聞き手が「2倍の高さ」あるいは「半分の高さ」に感じる音を実験的に求めることで作成された。
物理的な周波数(ヘルツ)とメル尺度の関係をグラフに描くと、概ね1000Hz前後を境にして低周波数域ではほぼ線形(比例関係)な一方、高周波数域では対数的な関係となり、変化が緩やかな曲線を描く。同じメル値の差が知覚上ほぼ同じ音高差に対応するよう設計され、聴覚上の音の高低と対応する音波の周波数を相互に変換することができる。
音声処理では、メル尺度は周波数分析結果を知覚的に意味のある表現へ変換するために用いられる。例えば、音声認識で広く使われるメル周波数ケプストラム係数(MFCC)の算出過程では、音声のスペクトルに対して、メル尺度上で等間隔になるように配置されたフィルタを適用する。これにより、人間が聞き取りにくい高音域の細かな変動を圧縮し、言語情報の識別に重要な低中域の情報を重点的に抽出することが可能になる。