<標本化と量子化>
Advanced Lesson



・ 標本化
アナログである音声波形は、そのままではデジタル化できません。
一定の間隔で音声波形の振幅を読み取り、情報として取り出します。以下はその概念図です。

 微妙に1秒まで達していませんが・・・(^_^;) そのうち修正します。とにかく、4Hzです。縦軸が電圧を示します。

黒い波形(4Hz/正弦波)が、元も信号です。ここでは、赤い線のところで情報を取り出しています。この、「一定の間隔で情報を取り出すこと」を、「標本化」や「サンプリング」といいます。
また、サンプリングの間隔のことを「サンプリング周波数」と言います。この場合、0.5秒で赤い線が8本あるので、サンプリング周波数は16Hzです。サンプリング後の波形は、緑で示したものになります。元の波形と比べて、大分角ばっています。実際は、もっとサンプリング周波数を高くすることで、元の波形に近い滑らかな波形が得られます。

ここで、赤い線の中でも0Vの部分だけに注目してください。この赤い線を1本おきに見ると0.5秒で2本、つまり4Hzで表の正弦波と同じ周波数です。ですが、よく見ていただければ分かりますが、波形を取り出せていません。ずっと0Vです(どこでやっても同じです)。次に、ピーク(1Vと-1V)の赤い線だけから取り出してみてください。サンプリング周波数は8Hzと2倍の周波数です。すると、今回は波形が見えてきました。
つまり、ある波形をサンプリングするには、その周波数の2倍にサンプリング周波数を設定する必要があります。
オーディオでは、サンプリング周波数が高いほど情報量が多くなるので、高品質になります。



・量子化
コンピュータは、ただサンプリングしただけでは、データとして記録できません。
「デジタルって?」でお話した通り、デジタルデータは1と0の2つの情報だけで記録しなければなりません。1ビットで大きさを表すと、本当に「1と0」の2段階になってしまいます。そんなことでは波形が記録できません。そこで、何ビットかまとめて1つのサンプルデータに割り当てることで、波形を段階として記録できるようにしています。
例えば、16bitの場合、1bitで1と0の2つの情報を表せますから、2^16(2の16乗) = 65536 となり、段階は [-32768 ,-32767 ,・・・  ,-2 ,-1 ,0 ,1 ,2 , ・・・ ,32767 ,32768]で、この値の中のどれか一番近いものに割り当てられます。一番近い、というのは、例えば上の表だと縦軸を65536で割り、0Vから1Vまで0から順番に割り当てていきます。その中で、サンプリングした電圧が最も近接している数値のことです。
つまり、このビット数が多いほど段階が多くなるということで、この段階が多いほど元の波形に近い、高品質なデータになるのです。

このように、サンプリングした情報をコンピュータが記録できる形に変換することを、「量子化」と言います。また、量子化に割り当てるビット数を、「量子化ビット数」といい、一般的には「ビット数」と表記されることが多いです。

量子化すると、元の波形情報とは違う位置にビットが割り当てられる部分がどうしても出てきます。上の表の例で見てみます。例えば表をあるビット数で量子化したところ、赤い線のところの電圧にぴったり合う割り当てが無かったとします。そして、一番近いところで量子化していったところ、最終的に青い線の波形が取り出せたとします。この波形は、元の波形と比較して、大きく誤差が生まれています。
この、「量子化に伴って発生した波形情報の誤差」を、「量子化ノイズ」と言います。

量子化ノイズは、量子化ビット数が多いほど少なくなります。


>>PCMについて
PCMとは、オーディオの中でも底辺に位置する形式です。PCMとは「パルス符号変調(Pulse Code Modulation)」のことで、標本化・量子化した直後のデータを2進法で表したデータです。また、標本化・量子化というプロセスでデジタル化することをPCMと呼びます。圧縮されたファイルであっても、最終的にはデコードされてこの形式に戻されてから、サウンドドライバに送られます。
PCM以外のデジタル化の方式としてDSD(Direct Stream Digital)というものが有りますが、ややこしくなるので割愛します。
簡単に説明すると、PCMが1と0で段階を作って音の大きさを表すのに対して、DSDは1と0の濃度で音の大きさを表します。DSDは1bitで扱われます。サンプリング周波数がMHz帯と桁違いで、スーパーオーディオなどに採用されています。

>>ダイナミックレンジ
オーディオに限らず、様々な分野で用いられる言葉です。
オーディオでは、特に周波数において「再生できる周波数の範囲」を指します。例えば、人間の耳のダイナミックレンジは20Hz〜20kHzと言ったような表現です。
他の分野でも、「表現できる範囲」のことを指す言葉として用いられています。


>>戻る