MP3【エムピースリー】MPEG 1 Audio Layer 3

(マルチメディア/音声/規格)

前へインデックスホーム


ISOのにて標準化された、MPEG 1に規定されているオーディオパート圧縮符号化方式のひとつ。
MPEG 1 Audioと呼ばれる(規格書はISO/IEC 11172-3)。

MPEG 1 Audioは、非可逆方式の圧縮方式で、主に聴覚の最小可聴限界マスキング効果を利用し、聴覚的に影響の少ないものを切り捨てることによって効率よく圧縮する符号化方式である。
単純なものから順にLayer 1、Layer 2、Layer 3の3レベルの符号化モードを規定している(レイヤが高いほど複雑だが高音質で高い圧縮率が得られる)。

サンプリングレートは、32kHz/44.1kHz/48kHzの3種類。
チャンネルは、モノラル/2チャンネルステレオ

レイヤー ビットレート 解説
Layer 1 32〜448kbps 周波数帯域を32のサブバンドに分割し、各サブバンドごとに、12サンプル(全体では384サンプル)を最大振幅が1になるようにスケーリングする。
これに、最小可聴限界とマスキング効果を考慮して算出したビット数を割り当て、量子化する(可聴限界以上のマスキングされないものだけが量子化の対象となる)。
Layer 2 32〜384kbps Layer 1に加え、3サンプルずつまとめて効率よく符号化するモードが加わる。
 Layer 1、2でのステレオは、2チャンネルを独立して符号化するか、実際にはモノラルで符号化し、スケーリングの倍率(スケールファクタ)だけ2チャンネル分持つジョイントステレオと呼ばれる方法がとられる。
Layer 3 32〜320kbps Layer 2に加え、
・帯域分割の細分化(変形離散コサイン変換(MDCT〜Modified Discrete Cosine Transform))
・ハフマン符号化(出現率の高いデータに短いビットを、低いデータに長いビットを割り当てて圧縮する)
・ステレオなどの手法(ステレオ信号を和信号(L+R)と差信号(L-R)として符号化するMS(Middle/Side))
が加わり、聴覚特性に合せたより効率のよい圧縮を行なう。

最小可聴限界 静寂時の可聴限界は周波数に依存しており、3kHz前後を頂点に高域と低域の感度は低くなること。

マスキング効果大きな音が存在すると、その周辺の周波数の低レベルの音が聞こえにくくなるという現象。

(*3)

MPEGのホームページ(英文)
MPEG Audioのホームページ(英文)
OMWF(Open MPEG Windows Forum)のホームページ

Create by 2000/6/3