ゲインリダクション(Gain Reduction)                         (C)Y.Utsunomia 2008-2010 コンプレッサー/リミッター/エキスパンダー/ノイズゲート ☆ 概要  これら、上記の名称で呼ばれる機能は、「入力の信号レベル」に応じ、「何らかの論 理」に従い、自動でレベル調整する機能である。コンプレッサー、リミッター、エキス パンダー、ノイズゲートの違いは、この「何らかの論理」が違いだけである。  レベル調整の機能としては「フェーダー操作」があるが、これらの機能は反応速度の 問題を除けば、フェーダーの操作で同等の効果を得ることができる。もっともそれには 相当の熟練を要するが、熟練を積むことで、これらの自動機能を上回る効果を得ること ができる。 (この一節は、フェーダー操作の訓練を啓蒙することが目的ではなく、単なる自動レベ ル調整の一種であることを、強く印象付けることが目的である)  基本的にはレベル調整だけなので、物理的には音色は変化しないはずですが、フェー ダー操作、自動ゲインリダクションともに音色(印象)が相当に変化する。一般的には コンプレッサー、リミッターでは倍音が減り、丸みを帯びた傾向が、エキスパンダー、 ノイズゲートではその逆の音色になる傾向がある。(ギター用のエフェクトのコンプレ ッサーでは、歪みの付加を伴うものがあり、その場合は倍音が大幅に増加する) <目的>  コンプレッサー、リミッターではダイナミックレンジを圧縮し、エキスパンダー、ノ イズゲートではダイナミックレンジを伸張(拡大)する。  総じては「レベル分布」を変えることが目的で、本来は音色を変えることが目的では ない。したがって、「本来的な使い方」としては音色をできるだけ変化させず、ダイナ ミックレンジのみをコントロールしたいわけである。 (しかし、上記はあくまで「本来」であり、現実には音色形成に使用することが半ば常 識的に行われている) <本来の使用理由>  現在、伝送系のダイナミックレンジ(実質的に録音や放送のS/N比といえる)は標準で 16bit/96dBにおよび、望むなら理論値において200dBを超えることすら可能だ。しかし、 第二次世界大戦当時、録音の実現はおろか、生放送においても電波の強さにも「限度」が あり、受信時のダイナミックレンジはせいぜい良くて40dB、悪いと0dB(受信限界)であ った。現在、放送の使命は変化しエンターテインメントと化しているが、当時の重要な 使命の一つが「戦略放送」で、「東京ローズ(NHK)」などは有名である。  戦略放送は敵対する相手国向けに、相手国言語で行われるが、当然のことながら距離 が離れている上に電波出力パワーが限られているために、「最大効率で送信」する必要が あった。この放送により自国の損害はある程度軽減され、相手国の戦意を喪失させるこ とを目的としているので、娯楽とはわけが違う。近年まで北朝鮮や旧ソビエトからは、 この目的で日本向けにも日本語の放送が行われ、日本にいる諜報員向けに数字読み上げ による暗号指令放送まであったことは有名である。また革命の多くは放送局のいち早い 占拠で実現することは常識だし、ベルリンの壁崩壊のきっかけの一つはラジオ放送であ った。  このときに如何に遠くのリスナーに明確にメッセージを伝達できるかは、如何に「歪 まない」「最大レベル」で電波に音声を乗せることができるかにかかっている。  第二次世界大戦当時、米国政府はRCA社フェアチャイルド社に「歪まない」「最大レベ ル」を実現するための表示装置と自動レベル調整装置を発注したが、そうして考案され た装置が、VU計とコンプレッサーである。(当時の「歪まない」とは、現在言うところの 「無歪み」とは異なり、音声、とくにアナウンスの明瞭度を損なわないという意味)  結果的にVU計は数値としては対数スケールとなっているが、本来はVUという単位(Vo lume Unit)であり、厳密には物理量ではない。(後世、dBm単位系に換算されるように なったが、本来は「感覚量の直接表示」を目指したものである)何に最適化されたかが 問題なのであるが、米国の男性ニュースアナウンサーの原稿読み上げがその対象とされ る。  伝達内容に直接関係のない、舌内音、歯搾音、ページめくり音などのピーク成分は無 視し、おおよそ実効値に近いレベル表示だが、反応速度を合わせこむために、表示針に 錘やダンパーなどを組み込んで最適化されている。明確に立ち上がりやリリースの反応 速度が数値規定されたのは戦後のことらしい。このような努力の積み重ねにより、第二 次世界大戦後、米国の放送網は全世界規模に拡大し、放送品質は全世界的に均質化され たのである。VU計やコンプレッサーの配備、キャノンコネクタの全世界的普及(朝鮮戦 争〜)にはこのような理由しかない。ちなみにNHKにおいても1970年代までキャノンコ ネクタは正式採用品にはなっていない。  戦後のポップスの世界規模での普及には、この米国の放送世界戦略である全世界放送 網が重要な役割を果たし、わが国においても多くのポップス人たちは極東放送(FEN)で 育ったとされる。  このため「いけてる音楽」のサウンドはコンプレッサーの効いた、つぶけたサウンド という「常識」ができてしまい、今日に至っている。また今日では「同じ音楽なら、より 大きな音のバージョンがよく売れる」という「理論(?)」に従いマスタリングが行われ るが、考えてみると戦略放送の時代と何も変わっていないのではなかろうか。  また現在の放送において、この発想の直系にあるのはコマーシャルの音声で、テレビ 番組を見ているときに、「コマーシャルになるとどうしてそんなに大きな音になるの?」 と感じたことは誰にも経験があるだろう。  十分なS/Nが得られている現在においても、限られた音の入れ物にどれだけ音量を詰め 込めるか、という問題は相変わらずで、そのためにコンプレッサーやリミッターは使用 される。  このことを実感するにはポップスのCDと生音楽を、それぞれaudacityに取り込み、そ れぞれ正規化を行い、それぞれのトラックの波形の面積(エネルギー量とも)がどれくら い違うか眺めてみるとよくわかる。audacityのトラックリニア波形表示は二重のアウト ラインで描画されているが、外側の濃い青色がピーク成分(ピークレベル)を、内側のや や薄い青色がおおよそ実効値(おおよそVUレベル)である。自分でマイク録音した音で は、濃い青色の部分が幅広く、やや薄い青色部分の幅が狭いが、ポップスのCDの多くで は、濃い青色の部分が狭く、やや薄い部分が広い幅になっていることが分かるはずだ。  別の言い方をするなら、ポップスではピーク成分が少なく、実効値が極めて大きく、 また平均レベルの大きさもただ事ではないことに気付くであろう。 *もう少し専門的には・・。 無線通信、放送業務について解説したが、実際には変調効率の向上だけではなく、音声 入力が一定のレベルを超えた場合(AM変調の場合)、音が歪むだけでなく、スプリアス と呼ばれる本来無いはずの電波成分(異なる周波数の)が増大し、あるいは送信出力 回路の安全動作領域を超えることから、送信出力回路故障の原因にもつながるのだ。 このため、リミッタは音の歪を軽減する変調効率改善目的のものと、一定以上のレベル を故意にクリップさせ、何が何でも一定レベルを超えないようにする回路が併用される。 PAなどでも同様で、パワーアンプ(電力増幅器)が最大出力に達し、クリップした状態 では、ダンピングファクタ(制動力)が突然0になり、スピーカーに対する制動が効か なくなることで、同様にスピーカーの破損率が上がることから、パワーアンプのクリ ップ以下のレベルで、故意にクリップさせることで信頼性を向上させることができる。 この用途にdbx社の#166のリミッタは使用される。正確にはこの目的で使用されるリミ ッタは「クリッパ」と呼ばれる。(ときにピーク・ストッパとも)  マスタリングの重要な技術のひとつに、このクリップ技術がある。再生時に使用され るD/Aコンバータも0dB(=最大出力レベル=物理飽和)での性能(音色)は不安定で 使えない。そこでマスタリングでは波形がクリップしていても、物理飽和を避けるため、 最終的に0.1〜0.5dBレベルを下げる(詳細は「増幅・正規化」の項を参照)。同じよう に波形はクリップしているにもかかわらず、音色が大きく異なることは不思議としか 言いようが無い・・・。意外と熟練者はマスタリングの工程ではリミッタやコンプレッ サはあまり多用しないのだ。  前説が増えてしまったが、学校教育の中でもゲインリダクション、とくにコンプレッ サーとリミッターは理解率が悪く、いわゆる業界においても相当に誤った解説が横行し ているのが現実である。専門誌や解説書においても、コンプレッサーとリミッターの違 いを明確に説明できているものは稀である。 <コンプレッサ>  冒頭説明にあるゲインリダクションは、「入力の信号レベル」に応じ、「何らかの論 理」に従い、自動でレベル調整する機能であるが、コンプレッサでは入力信号レベルに 対数反比例するように増幅率が下がる機能である。  手動でフェーダーを調整することに例えよう。フェーダーの初期値を0dBとし、入力 レベルをメーターで見ながら、メーターの振れに応じてフェーダーを下げる、動作であ る。このときに見るメーターがVU計かピークレベル・メーターかでフェーダーの下げ方 がかわるが、コンプレッサでも同様に、ピークレベルに反応するタイプと実効値に反応 するタイプがある。一般的には後者が多いようであるが、メーカーにより、何にどのよ うに反応するかが回路デザイナーのセンスである。 <リミッタ>  コンプレッサと同様であるが、メーターのガラス窓に紙が貼り付けてあり、一定レベ ル以下では針がどこにあるのか分からない(=フェーダーは0dBのまま)で、入力レベ ルが一定レベル以上になると針が見えるようになり、メーター針に対数反比例するよう にフェーダーを下げる操作(機能)である。  この一定レベル(紙から針がのぞきはじめるレベル)をスレッショルド(threshold l evel=閾値)という。  閾値以下では何の圧縮動作もせず、閾値を越えたところからコンプレッサ動作が始ま るものをリミッタと呼ぶ。とくにピーク値に反応するように設計されたものをピーク・ リミッタと称するが、一部には、ピーク・リミッタという場合は、波形を故意にクリッ プする機能を表す場合もある。(dbx社#166など) 注釈  いくつかの解説書や某月刊誌ではコンプレッサ、リミッタともにスレッショルドレベ ルを持ち、これといった違いはない、という説明が見られるが、明らかに間違いである。 現実の製品では確かにスレッショルドレベルを設定できるものがあるが、スレッショル ドレベルを−∞にしたとき(あるいは絞りきり)がコンプレッサ・モード、スレッショ ルド・レベルを僅かにでも上げればリミッター・モードである。要はスレッショルドの 有無のみでこの用語は使い分けられる。この問題では某編集部とも激論を交わしたが、 異議がある方は明確な根拠を示し反論いただきたい。(そのような製品やプラグインが ある、というのは明確な根拠として受け付けられませんが)  少なくとも製品の原語版(多くは英語)や国家の定める工業規格には明示があるのに、 業界や専門教育機関のこの体たらくぶりはどうしたものだろう。  しかし現実的には−∞のスレッショルドレベルは技術的になかなか難しく、これを保 障するメーカーが少ないことも事実ではある。代表的メーカーではdbx社があげられる。 社名もそこに起源がある。 <エキスパンダー>  コンプレッサとは逆の動作で、手動による操作で言うなら、フェーダー初期値は−∞、 メーターの振れに対数比例するようにフェーダーを上げる機能である。  コンプレッサ動作と「相補」的動作であることから、アナログ時代には録音時にはコン プレッサで圧縮した信号を録音し、再生時にはエキスパンダーにより逆圧縮(伸張)する ことで、録音システムのダイナミックレンジを拡大する装置が実用化されていた。  実際のスタジオ作業では、このような相補的な使い方だけではなく、聴感上の圧縮感 の改善や雑音の低減にもしばしば使用される。しかし他のゲインリダクションに比べ使 い方がやや難しく、ダイナミックスに対する聴感覚の熟練が必要である。 <ノイズゲート>  エキスパンダーにスレッショルドを設けたものである。一定の入力レベルになるまで は何の反応もなく(出力しない)、一定の入力レベルに達すると対数比例するようにフェ ーダーを上げる機能であるが、実際の製品ではスレッショルドレベル以上で単に出力ON になるものもある。  またスレッショルドレベル以下で出力停止では使いにくいため、ゲートオフ時のレベ ルを設定できるものもある。  audacityでは、上記のコンプレッサ/リミッタの定義が正しく、単に「圧縮(compress or..)」の表記があるだけである。追加のプラグインにおいても同様のようである。また、 レベルをオーバーチャージするための効果については、この紛らわしく誤解を与えやす い名称が使われず、「レベラー」なる名称になっている。 <サイドチェーン>  ゲインリダクションは「入力レベルに応じた」・・・であるが、常に「その入力」に 反応させたいことばかりではなく、ときには、異なる入力(別トラック)のレベルに応 じてゲインリダクションを作動させたい場合もある。例えば映画やドラマなどで、台詞 のあるところでは自動的にBGMやSEのレベルを下げたい場合がある。このように他の入力 でゲインリダクションを作動させることを、サイドチェーン動作、あるいはkey in動作 と呼ぶ。  他の入力でゲート動作を行うaudacityの効果に「オートドック(auto duck)」(オー トダックの方が良いのでは?)がある。  ゲインリダクションしたいトラックと制御トラックが必要で(前者がBGM、後者が台詞 か)、制御トラックが「空白」のとき前者のレベルは規定値になる。制御トラックに何ら かのデータがある場合前者のレベルは設定値まで下げられる。 *ゲインリダクションに共通するパラメータ* <スレッショルド・レベル>(閾値) 例えばリミッタでは、入力レベルが「ある一定のレベル=スレッショルドレベル」を 超えると、回路は圧縮動作になり、出力レベルは入力レベルに比例しなくなる。 入力がこのスレッショルドレベル以下のときには、信号のレベル分布は何等の影響を 受けない。無論レベル分布のみならず音色も、何等の影響も受けない。  注意しなければならないことは、スレッショルドレベルはあくまで入力レベルについ てであり、結果としての出力レベルは圧縮比によって決定されることだ。audacityの プラグインでは、リミッタ圧縮後に正規化するスイッチが付いていたりするが、どのよ うに作用するかは、あくまで入力レベルについてなので気をつけねばならない。  気をつけねばならない例としては、エンベロープツールとの併用などだ。エンベロー プツールでダイナミックスを描き、それにリミッタ処理を・・と考えていても、実際の 処理は、先にリミッタ処理が行われ、後からエンベロープが反映される。このような場 合は、エンベロープツールでダイナミックスを描いた時点で一旦ファイル出力するか、 あるいは「ミックスして作成」などのコマンドを用いて、エンベロープを固定した後に リミッタ処理を行う。 audacityの標準搭載コマンドでは「効果」→「圧縮」がそれにあたるが、リミッタとも コンプレッサとも書かれていない。 スレッショルド(閾値)の範囲は-60dB〜-1dBであるが、コンプレッサモードは-60dB にセットしたときがそれにあたる。-60dBは-無限大ではないが、実質の音楽ダイナミッ クレンジから言えば-60dBは-無限大に等しいと考える。 グラフィック表示について  「圧縮」の画面が開くと、いくつかのスライダーとともに効果の度合いを示すグラフィ  ックが表示される。ver,1.3.8まではスライダーの表示に従ったグラフなのだが、  ver,1.3.9以降ではなぜか、「圧縮の後0dBになるようにゲインを上げる」したときの  グラフ表示に変更された。見やすくなったのか、わかりにくくなったのか・・。 <ノイズフロア>(ver,1.3.9〜) 一般に既存の音楽信号には結構なレベルでノイズが含まれており、多くのCDでは実質の S/N比はせいぜい良くて80dB、月並みには60dB台だ。(曲間はミュートされているので 直接的には気にならないが・・) リミッタやコンプレッサを用いて圧縮を行う(かつ正規化する)と、間違いなくこの もともと含まれているノイズが持ち上がってしまい、耳障りになるものだ。これに対応 するため、一定以下のレベルをレベル的に押さえ込むために、「ノイズゲート」を併用 できるように、この「ノイズフロア」なるパラメータがある。圧縮作業後にノイズ成分 が気にならないようなら、この「ノイズフロア」は最低(−80dB)のままでよい。 ノイズが気になるようなら、UNDOしノイズフロアを適切にセットし直し、圧縮作業を やりなおす。 (参照:音がある部分では、人間の聴覚は「マスキング効果」と呼ばれる現象のために  ノイズが聴こえにくくなる。圧縮を行うと、ノイズとのバランスが変化し、ノイズが  聴こえやすくなるのだが、そもそもどれくらいのノイズが含まれているのか把握した  いものだ。このようなときに強力な視覚化の助けになるのが「FFT」というプログラ  ムで、フーリエ解析しスペクトラムを可視化することで、もともと含まれているノイ  ズフロアを直視できるようになる。audacityにもFFTは搭載されているが、静止した  「部分」の観測は「解析」→「スペクトラム表示」でも可能だ。最小表示レベルが  低い場合は「編集」→「設定」→「インタフェース」から「メーター/波形dBの表示  範囲」の数値を「-145dB」に設定すると最大分解能になる。   このようなときには、「そのほかの有用なソフト」の項で推奨しているWaveSpectra  .exeを使用してみよう。リアルタイムに刻々と変化するスペクトラムと、おおよそ  一定の値になっているノイズフロア(まさに・・)を直読できる。  実際のノイズフロアはこのスペクトラム上のノイズを積分したものなので、FFT表示  上のノイズフロアは数値的にはかなり低くなる。S/N比70dB程度で、FFT上のノイズ  フロアは-95〜110dB程度になるだろう。S/N比90dBでは同様に-130dB程度の表示になる  が、そのようなソースには滅多に出会わないだろう・・。) <比率>(Ratio=圧縮率) スレッショルド以上の入力があったときに圧縮動作に切り替わるが、どれくらいの圧縮 を行うかが、この「比率」だ。数値が1のとき(audacity では無理だが)圧縮はまった く行われず、数値が大きくなるほど激しく圧縮される。audacityの場合、入力対出力の 対数比(dB値)を指すようになっているようだ。どのような目的で「圧縮」するかで それぞれの最適パラメータは変わってくるが、とりあえず効果を確認するには、スレッ ショルドを-20dB以下、比率を1:4以上にセットすれば明確に効果が理解できるだろう。  audacityの場合、動作は正しいのだが、それらしい派手でドスの効いた音にはなかな かならないが、「圧縮」とは本来そういうものだ。レベル分布を変えるのが本来の使命 で、音色が派手に変わるのは変態なマシンだ。 <アタック時間>  例えばリミッタでは、入力レベルがスレッショルドレベルを超えると圧縮動作が開始さ れるが、圧縮動作とは「ボリュームを絞る」あるいは「フェーダーを下げる」を手では なく、電圧(アナログ)または変数(デジタル)で行うことである。 下げるといっても目標レベルになるまで「少し下げる」のであるが、どれくらいの速さ で下げるか、がこの「アタックタイム」なのであるが、アタックタイムが遅いと、下げ 終わるまでの間は、圧縮は不十分で、スレッショルドがどのようにセットされていよう と、無関係に高いレベルが出力されることもある。  逆に早すぎる反応速度では、「コシ」や「パンチ」が失われ、平坦な印象の音になる。 ソースや用途により最適値が違うのだ。 参考:アナログからデジタルへの移行期、デジタルのゲインリダクションは大変不人気   だった。ゲインリダクションは高速度のレベルエンベロープの抽出と、高速度の   滑らかなレベル調整なのだが、どちらもリアルタイム・デジタル処理が苦手とする   もので、当初はビット深度も浅かったこともあり、明確に使い物にならなかった。    しかし等価予測処理アルゴリズムが編み出され、録音機などへの応用については   一定の成果をおさめた。そのアルゴリズムとは・・   デジタルの問題点は、正確なレベルエンベロープを抽出しようとすると時間がかか   り、また滑らかなレベル調整を行おうとすると同様に著しく遅れが生じる、という   もので(無神経にレベル調整すると、波形に段差が生じ、その結果スペクトラム   上にエネルギー拡散し、「パリパリ」ノイズを生じる)、処理速度が大幅に向上し   たとしても容易に解決できるものではなかった。この問題を完全に解決するには   これから来る入力レベルを「予想」し、前もってレベルを調整し始めれば、「遅い」   システムでも間に合うし、最適な調整も可能となる。なにせ「未来がわかる」から   だ。これと等価のことができればよいのだ。アナログとデジタルの本質的違いは、   デジタルでは常に遅れが伴い、また遅れを作り出すことが容易な点だ。これを利用   し、入力された信号はすぐにエンベロープ抽出し、信号そのものは必要量遅らせ   (数ミリ秒〜)、その後レベル調整処理するが、レベル調整処理部分から見ると   その処理に使用されるエンベロープ情報は、遅れの分だけ「未来の情報」なのだ。    この手法はMDレコーダの一部に採用され、現在のマスタリング用のプロセッサで   も見られる方法だが、そもそもはアナログレコードのカッティングマシンに備え   られたものだ。アナログレコードの溝の間隔は記録される信号のレベルや位相差に   依存した最適値を持つが、長時間録音しようとすると、溝を接近させなければなら   ず、そのためにはこれから来るレベルや位相差を予知する必要があった。そのため   メインの再生ヘッドのはるか左側に「先行ヘッド」と呼ばれるヘッドを設け、予知   を行っていた。このアイディアは決して古いものではなく、デジタルで例えるなら   これから来る信号を予知し「ビット深度」を逐次最適化していることに相当するか   らだ。デジタル・オーディオで最も近いものはMP3のVBRモードなのだが・・・。   また、AAC圧縮は予知圧縮するアルゴリズムを持ち、高圧縮、多チャンネル化を実   現しようというものだ。(audacityでのエンコードは非対応)    したがってこの方式のデジタルのコンプレッサやリミッタではアタックタイムに   「負の値」をとりうる。まさに勘の良い熟練者のような効き具合だ。    しかし上記の解説では、必ず「遅れ」を作り出す部分が必要となり、すなわち   リアルタイム処理が弱いと言うことになる。DAWにはあまり関係の無い話なのだが   (なぜなら全体の発音を遅らせればよいだけなので)、参考まで。 <減衰時間>(リリースタイム) アタックと同じく、リミッタを例にとると、 入力がスレッショルド・レベルを超えると圧縮率に従いボリューム(フェーダー)が 絞られるが、その後レベルが下がるとボリューム(フェーダー)は元の位置(0dB)に 戻ろうとする。この戻る早さがリリースタイムで、さっと素早く戻すか、ゆっくりと 戻すかの違いだ。 一般的にはアタックタイムよりも遅いと、自然でわかりにくい傾向がある。しかし、 リリースタイムが余りに遅いと、レベルが抑制されっぱなしになるため、レベルが下が っただけで、結局レベル分布そのものはあまり変わらなかったりする。 <その他のスイッチ> リミッタやコンプレッサなどの「圧縮」系ゲインリダクションは、基本的にレベルは 下がるのみだ。なにせ圧縮とは抑制だからだ。 しかしそれでは使いにくいので、圧縮処理した「後」、使いやすいレベルまで増幅する ことが一般的に行われる。 注)先に例出した放送やPAなどで用いられる場合は、「音品質」ではなく出力デバイス  の安全動作領域から「キャリブレーション」されるので、圧縮処理後に増幅はしない。  audacityなどのデジタルオーディオでは、無条件に「0dB」にキャリブレーションされ  るが、先のマスタリングの例のように、実質的に-0.1dBを基準とする場合もある・・  無論、音楽は出音中心なのだが、技術的には明確に基準レベルの概念を持つべきだ。 どうせ増幅するのならば・・という配慮からか、最近のバージョンでは「圧縮の後0dB になるようにゲインを上げる」スイッチが装備されている。どうせそのように使用され るなら・・という配慮からか、表示されるグラフもver,1.3.9以降では、このスイッチ をONにしたときのカーブになってしまった。 「ピークに基づく圧縮」スイッチ このスイッチにチェックを入れると、波形のピーク値を包絡線で結んだ値を入力レベル とし、処理を行う。 このスイッチにチェックが無い場合は「実効値」あるいは「平均値」を入力レベルとし て処理を行う。(正確には確認していないがaudacityでは実効値のようだ) ピーク値と実効値の違いは、もちろんピーク値の方が大きな値になるので、より大きく 圧縮される。また、突発的にピーク値を多く含むソースでは、圧縮後のレベルがふらふ らと変動する。実効値の場合は、突発的なピーク値はほとんど無視されるので、先例の ソースの場合でも、変動が比較的少ないが、ピーク成分はそのまま抜けてしまう可能性 がある。 ○レベル・オーバーチャージャー 多くのDAWやアウトボードには、マスタリング用として、レベル・マキシマイザーなどの、 「あり得ない録音レベル」を実現するためのプラグインがある。 なぜあり得ないかは、例えばaudacityでは、任意のソースに対して「増幅」や「正規化」 の処理を行うと、自動的に最大化され、それ以上の増幅は「クリップ」を生じるために 無理ということになる。  それ以上の聴感覚レベルを実現しようとすると、ひとつの選択肢として前項のリミッ タやコンプレッサを用いて、レベル分布を高レベル側に偏らせることで、等価的に 音量を上げる方法がある。しかし、これらのゲインリダクションには特有の音品質の変 化があり、元のニュアンスを保ったままの聴感覚レベルの増大には限度があり、せいぜ い+10dB程度のオーバーチャージしか得られない。  しかしポップス業界の過剰レベル要求は厳しく、+14〜+16dBは詰め込まなければなら ない。なぜこのような狂った感覚がまかり通るのか、この項では解説は行わないが、手 近なCDを一度audacityに取り込んでみれば、その事実については理解できると思う。 ゲインリダクション(レベル分布の変更)で実現できないほどの「聴感覚的レベル増大」 を行うには、聴覚生理的現象としての「歪の有効利用」しかない。この分野は商業に結 びついているためか、基礎的研究がある程度進んではいる。が、それもこの項では解説 しない。(筆者が内容に同意できないからだ) とにかくaudacityにもそのような用途のためのエフェクトが装備されている。 レベラー(ver,1.3.x以降に搭載)がそれだ。 効果としては穏やかなコンプレッサ、ソフト・クリッパー(穏やかな歪付加)、レベル の持ち上げなどの複合処理のようだ。 -20dB、1kHz正弦波での変化具合を掲載する。 効果度合い 処理後のレベル 歪率(THD+N) 無し    -20dB      0.02% 右     -18.4dB     0.03% そこそこ  -16.8dB     0.044% 強く    -15.3dB     0.054% より強く  -13.7dB     0.064% 最強    -12.0dB     0.072% 上記の数値はあくまで「-20dB/1kHz/正弦波」のときの数値であり、レベルや周波数が 変わると大幅に変化するので、ちょっとした参考程度にしかならない。実際に音を処理 し、感覚的に把握するしかないようだ。