録音レベルの最適化とS/N比   (参照 増幅・正規化)                         (C)Y.Utsunomia 2008-2010                操作のみ参照する場合、末尾30行へジャンプ  録音技術の習得において、その最も基礎的な項目として録音レベルを「適正に設定」 するという技術がある。 「適正に設定」とは録音対象の最大音量時にクリップしない(あるいはオーバーレベル を起こさない)、最大の録音レベル調整状態を「適正」とし、これから来るであろうピ ークレベルを「予測する」ことが最大の難関となる。一般的な音楽でさえ平均的な「メ ゾフォルテ」状態から「フォルテッシモ」(結構強い音)がどれくらいのレベルになる かは、演奏者や会場によって相当にばらつき(10dB以上、ポップスにおいても同様)が あり、ライブにおいても、大喜びで興奮している観客の拍手と社交辞令的な拍手では相 当なレベル差がある。  オーバーレベルやクリップを起こすと、録音は不可逆的変質(元に戻らない劣化)を 生じ、歪んだ、あるいは割れた音になり「リアルさ」から遠ざかっていく。(私が専門 教育を受けた最初に、師匠は故意にこのオーバーレベル状態を体験させ、正常なレベル の把握以前に、先に異常な状態から把握させられた。自転車の運転はコケてみて初めて まっすぐ走れるようになる。 確かに、この歪んだ状態も視点を変えれば重要な表現のひとつなのだが)  旧世代の録音システムでは、このオーバーレベルを恐れ録音レベルを低く設定すると、 たちまち ○システム(録音機の電気回路に起因する、多くはボルツマン定数を起源とする)が発 生するノイズと、 ○媒体であるテープが持っているノイズ(テープ磁性体が粒状であることに起因する、  デジタルで言えば量子化ノイズに相当するノイズと、 ○テープが磁性体であり、その特性が磁気ヒステリシスを利用していることに起因する  ノイズがある。俗に言う「ヒスノイズ」とは、これを指す。 (これら全てのノイズに「ヒスノイズ」の語をあてるのは明らかに誤り) に埋もれてしまい、録音レベルが低いほどこれらのノイズが相対的に耳に付くようにな り、その状態をS/N比が低い、あるいは単にS/Nが悪いという。  DATではテープを使用するものの、この媒体であるテープに起因するノイズは存在せ ず、耳に聴こえるノイズはマイクとマイクアンプの発するボルツマン定数起源のもので ある。この無音(あるいは静かな)のときに聴こえるノイズは容易に識別でき、静的ノ イズとして認識できる。 参考))カセットテープによる生録音でも、無音状態の部分で聴こえる「シャー」音の    大部分は、録音機の電気回路・・マイクやマイクアンプで発生したもので、いわ    ゆるテープによるノイズは、S/Nの良いCDなどをダビングしたときに聴こえる残    留雑音あるいは、録音レベルボリュームを絞りきった状態で録音したときの残留    雑音である。これはDATによる生録音でも同様で、聴こえるほとんどすべての    ノイズはマイクやマイクアンプに起因するものである。つまりテープの立場で言    えば、「ソースに含まれている」「録音された」ノイズとも言える。  これとは別に、音があるときにしか存在しないノイズが、アナログテープ録音でもデ ジタルの録音システムにも存在する。(動的ノイズ)  このノイズを簡単に取り出すには、例えば10KHzの正弦波を録音再生してみるとわかり やすい。正弦波の音とともに「シャー」というホワイトノイズのような音が聴こえるは ずだ。デジタルの場合は低いレベルほど顕著にあらわれるが、アナログテープの場合は 磁性体が粒状であることが原因で「変調ノイズ」とも呼ばれる。同じアナログテープ録 音でも、カセットテープとオープンリール(2トラックステレオまたはフルトラック) では、この動的ノイズは量的にも質的にも全く異なる。カセットテープの音の貧弱さに はこのような理由もある。 またアナログ録音でノイズリダクションを使用しているときの固有の動的ノイズは、 その音からブリージング・ノイズと呼ばれる。  デジタルの場合も同様に音があるときのみにこのノイズはあらわれるが、これが「量 子化雑音」と呼ばれるノイズである。マイクを使用して身近な音を録音したときに、そ れを再生してみると、衣類の摩擦音や地面を歩く音が異常に「シャリシャリ」した音に なっていたりするが、このシャリシャリが「聴こえる」量子化雑音である。その音信号 に割り当てられるビット数が少ない(=レベルが低い)ときに現れやすいので、確かに レベルを上げたり、エンファシスを使用すると改善する。また量子化雑音はコンバータ ーに依存するため、DATで録音したシャリシャリの録音物であっても、現在主流のデルタ シグマ型D/Aコンバータを用いて再生したり、本稿のテーマであるaudacityを用いてビッ ト数変換(例えば本稿の「増幅」や「正規化」を行うだけでシャリシャリは改善される。  ここで面倒なのは、「あのシャリシャリ感が良かったのに、増幅したらそれが無くな ってしまった」という場合で、この量子化ノイズが目当てなのなら、内部演算ビット数 を低く設定し処理を行うと再びシャリシャリを得ることができる。(が、本末転倒なの では)    このように録音に付随するノイズの問題は、大別しても静的なものと動的なものがあ り、単純に録音レベルを高くすれば解決できるわけではない。 参考))このような動的ノイズを定量的に把握するにはFFT(高速フーリエ変換)によ    る解析で、THD+noiseなどの項目と、展開されたグラフを参照すると把握しやす    い。 WaveSpectra.exe efu 氏作を推奨 そして現代では・・  24ビットの録音では16ビットの録音に比べ、その録音レベルを低く抑えても実質 的なS/N比は悪化しない。これは媒体であるメモリーカードやハードディスクが固有の 雑音を持たないためである。同時にA/Dコンバーターの実質S/N比が110dB程度しか得ら れないため、仮に高い録音レベルをとっても、その高くとったレベル分だけノイズフロ アも増大するためである。おまけに録音ソース側のダイナミックレンジが、マイク録音 の場合良好な場合で80dB程度しか確保できないことも、その理由となる。  とくに近年販売されているいくつかのポータブル録音機では、内蔵マイクロホン・ア ンプ(Head Amp・・略してHAとも)とA/Dコンバータの間にレベル調節機構を持たない 製品もあり、録音レベルの設定の方法は見直しの時期に来ているといえる。  このため現在のデジタル録音(正確には録音機の設計に依存)では、かつてのように 録音レベルを高めに設定するメリットは無く、むしろ高めにとることのデメリットの方 が大きいと言わざるを得ない。  一般的な目安としては最大録音レベル(ピーク)で-20〜-30dB程度が確保されていれ ば、持ち帰り後レベル・ノーマライズ(正規化または増幅)を行うことで十分なS/Nを確 保できる。「ポータブルレコーダーとの連携」の項に関連事項有り。 ○増幅の方法により結果が異なること  注意しなければならないことはノーマライズの方法の選択で、例えば ☆その再生を行いながら単体のミキサーなどで増幅した場合と、 ☆録音メディアに記録されたファイルを直接デジタル的に処理する、 のでは、品質も得られるS/N比も大きく異なる。  アナログ的な増幅を行った場合、その使用回路や手法に関わらず、入力信号に含まれ るノイズに加え増幅回路が持つ「入力換算雑音」が加わるため、アナログ的に増幅を行 うと必然的にS/N比は悪化する。(デジタルミキサーを用いても通常操作では同様にS/N 悪化するので注意)  取り込んだファイルをデジタル的に増幅する、とは各サンプル単位で掛け算を実行す るだけなので、増幅後に現れるノイズはもともとソースに含まれているノイズに増幅率 を掛け算したものだけなので、理論的にはS/N比は変化しない。  *注 「ディザ」という雑音を付加する設定がONになっている場合は、そのディザ分  のノイズが増加する。(もとの録音のビット数が16bit以下で、実質的にビット数変換  を同時に行う場合は、ディザを併用することで逆に聴覚上のS/N比が向上する場合もあ  る)  audacityにおいてこの作業に適合する命令は「効果」のプルダウンメニューの中にあ る「増幅」と「正規化」である。どちらも同様の結果が得られるが、「増幅」の場合は 波形を見ながら、経験と知識を駆使することで、より適正なレベルに調節できる。  実際のオリジナル録音物は無意味なピーク成分を多く含む。 例えば、スタート時や終了時のファンクション切り替えノイズ、マイクセッティングの 変更などに伴うマイクへの接触、イレギュラーなノイズや、場合によっては拍手なども それに含まれる。 「正規化」を実行するとそれら無意味なピーク成分も含め、そのピーク成分がクリップ しないように増幅値を決定するため、多くの場合必要な本編部分のレベルが必要なレベ ルに達しない傾向がある。  「増幅」コマンドの場合はコマンドを開いた状態、では「正規化」と同じ増幅度を推 奨してくるが、「クリップを許可」にチェックを付けることで任意の指定を行うことが できる。 このことを加味し手順をまとめると・・・ 1)ピーク部分を避け、本編の最大レベルと思われる部分を「左クリック&ドラッグ」   で指定し、 2)「効果」→「増幅」を選び、推奨増幅率の数値を読み取り、そのまま「キャンセル」   で閉じる。 3)増幅処理を行う全領域、全トラックを指定し、「効果」→「増幅」を選ぶ。 4)「クリップを許可」にチェックを付け、2)で読み取った数値を推奨欄に入力。 5)「OK」をクリックし増幅を実行。・・・その後、ファイルの書き出し。  その後、「クリップを許可」しているため、クリップした部分を再生し、クリップが どのような影響を及ぼしたかを検証しておく。もしも聴覚的に許容できない変化がある 場合はUNDOし、もう一度増幅度を加減し実行する。 ** クリップした場所を明確に表示するには、「ビュー」のプルダウンメニューの中 の「クリッピングを表示」にチェックマークをつけると、クリップ部分は赤く表示され る。 *** 関係者にCD-Rなどでデータ配布する場合はさらに 注)ver,1.3.8以降を使用する場合以下は無効。項末を参照。 6)「効果」→「増幅」を選び、推奨増幅率の窓に-0.1〜-0.4dBを入力し実行する。  この処理はD/Aコンバータの物理飽和(物理的クリップ)を回避する手法である。** 項で赤く表示された部分が物理飽和の部分で、6)項で処理された同じ場所も同様に波 形の先端は平らにクリップしており、音的には6)項と**項はレベルが0.1〜0.4dB違 うだけで同じ音がするはずなのであるが、6)項で作成した、わずかにレベルを落とし た音は**項で作成した音に比べ、ひずみ感が少なく、また再生環境による違いが発生 しにくい。  フルビット(物理飽和)は通常の単なる波形上のクリップ以外に再生系の異常挙動 (D/Aコンバータやその周辺の回路で)を誘発することが原因で、マスタリングなどの 作業を行う際の最終処理としても重要な工程である。  当たり前のことであるが3)項の処理を行うときに-0.1〜-0.4dBレベルを下げたので は6)項と同じ結果にはならない。必ず2工程に分けて処理しなければならない。 ***************************************  このようにaudacity では頻繁に数値入力を使用するので、操作は「操作ノート」や 「作業シート」のような、書き物をしながら行うと学習が早く、ミスを減らすことがで き、再現性が確保される。再現性の確保はプロ仕事の基本である。 *************************************** 項末  ver,1.3.8以降で、audacityは完全浮動小数点化されたため、5)でクリップし たように見えても、内部的にはクリップしていない。つまり6)を実行しても、物理飽 和はそのまま物理飽和のまま残ってしまう。つまり無意味なわけである。  このような場合は一旦「非浮動小数点ファイル形式」でファイル出力し、そのファイ ルを読み込めばクリップが確定するため、同様な効果が得られはずだが、なぜか音色が ver,1.3.7以前とver,1.3.8以降では異なっている。この作業にはver,1.3.7以前を筆者は 推奨する。 「トラック数とdB」項を参照。