ATRACが求める圧縮とは何なのか?
ATRACは人間の耳の聴覚特性を利用した信号圧縮処理をします。
またATRACに入る信号は機器に入力された「生のデジタル信号」です。
1.入力信号を帯域分割フィルター(QMF※1)によって、0kHz〜11kHzと11kHz〜22kHzの
2つに分けます。次に、2つに分けられた0kHz〜11kHzの方をさらに帯域分割フィルターによって、
0kHz〜5.5kHzと5.5kHz〜11kHzの2つに分けます。よって入力信号は帯域分割フィルター
によって0kHz〜5.5kHz、5.5kHz〜11kHz、11kHz〜22kHzの3帯域に分割します。
さらにこのステップで11kHz〜22kHzの信号を半分の周波数0kHz〜11kHzに変換します。
もとデータは44.1kHzサンプリングで情報を作成していますが、11kHz〜22kHzを半分に
するということは22.05kHzサンプリングで情報を作成したのと等しく、サンプリング周波数が
低くなると、データの持つ周波数帯域であるスペクトル分布で元データとサンプリングにより
高域に追加されたスペクトル分布でダブル部分が現れます。このダブった部分で、ある折り返しを
使い信号の間引き操作を行っています。この段階ですでにデータの削減を行っているのです。
なおこの部分は自分でも良く理解できていないのでこのような隠しにしています。
2.
範囲を750Hzずつ32の帯域に分割する。この1単位帯域をサブバンドと呼ぶ。
PASCはこの「1サブバンド」単位に圧縮処理をします。
※ATRACでは3つの帯域に分割し、その各帯域の中を256+128+128スペクトルに分け、
52スペクトルを1バンド(PASCのバンドとは意味が違います)として、
その1バンド単位に圧縮処理をします。
2.分割されたサブバンドに対して、聴覚特性による圧縮を行います。音の周波数や
音圧によってその音がよく聞こえたり、全く聞こえなかったりします。
そのような音を「等ラウンドネス特性」をもとに、聞こえる音のみを抽出します。
さらに、小さい音は大きな音に隠れて聞こえなくなってしまう「マスキング効果」
を利用して、最終的な「聞こえる音のみのデータ」に仕上げます。
※この処理自体はATRACも同様に行っています。
3.聞こえる音のみになったデータに対して再量子化、つまりビットを割り当てます。
この段階でCDなどと同じように16Bitで処理をしてもまだ192kbit/Secには納まりません。
そこで「可変ビット方式」で処理をするのです。
PASCでは1サブバンドあたり6〜8Bitで、最大21Bitで量子化しています。
ここで〜(から)や最大という言葉を使っているのは全サブバンドに対して均一な
Bit値で処理をしているのではなく、そのサブバンド相応のBit値で量子化していると
言うことです。あるサブバンドでは6Bitで十分だが、ある低い周波数のサブバンドは
21Bitないと表現しきれない、またその瞬間だけ周波数が全くない場合はBitを
振り当てなくてもいいということです。つまり計32バンドの合計Bit数が192kbit/Secを
越えなければ、その32バンド中でフレキシブルなBit振り分けが出来るのです。
※ATRACでは1バンドあたり最大16Bitで行われています。ただし再量子化するデータが
PASCのものとは異なりますので注意して下さい。
以上3ステップを踏んで圧縮処理が行われます。まとめますと、
機器に入力された「生のデジタル信号」が、可変ビット方式で処理され192kbit/Sec以下
ならば圧縮せずに記録する。
上記処理されたデータが192kbit/Secより大きかった場合は、圧縮処理をして
192kbit/Secのデータを作り出し、記録する。
基本的にCDの音は16Bitで量子化されていますが、必要なBit値の平均は4〜5Bitとと言われています。
つまりCDをDCCに録音した場合、ほとんど圧縮処理を必要としないため、遜色(劣化)のない録音が
可能なのです。また高サンプリング周波数や高量子化で生成されたデジタルデータもその瞬間の
音楽データが可変ビット方式の処理で、192kbit/Sec以下であれば圧縮は行われないことになります。
※1QMF
クワドラチャー・ミラー・フィルター(Quadrature
Mirror Filter:直交鏡像フィルター)