サンプリング周波数 2                         (C)Y.Utsunomia 2008-2010  音楽への応用 そこに音楽、あるいは音があり、それを記録再生するのに、どのようなサンプリング周 波数を用いようと音楽そのものが変化するものではない、とされる。つまりカセットテ ープで録音再生しようと、MDで録音再生しようと、非圧縮96KHz/24bit、U-87で録音しよ うと、音楽そのものや演奏そのものが変化することはない、というのである。音楽家の 立場と威厳では「そうあって欲しい」という希望的意見として、そのように解かれるが、 現実的には、非圧縮、高ビットストリーム(高サンプリング周波数/高ビット深度)で録 音されたものからダウンコンバートし作成されたMDと、そのままMDで録音されたものと では明確に品位のみならず、そのディスクに収められた音楽(演奏)の評価そのものが 変化する事実がある。  映画(映像)のコンクールなどでは、このようなダウンコンバート制作を明確に禁止 しているが、音楽においては規定はおろか、そのような事実さえ否定される。  しかし、ここではそのことには敢えて目を閉じよう。 ○速く正確に演奏できないことを解消するのに利用いる。  (その前に分かりやすい例を・・・・オラは死んじまっただ〜、または初めてのちゅ   う〜)  要は「テープ速度」を遅くして演奏し、演奏・録音が終わったら「元のテープ速度」 で再生、ミックスを行う。「変な声のエフェクト」としては、「返ってきた酔っ払い」 のヒット、近年では「きてれつ大百科のエンドテーマ曲〜コロすけの・・」などが代表 的であろう。  これらはテープ速度が通常38cm/毎秒で制作中に、歌の録音時のみ半分の速度である 19cm/毎秒のテープ速度にすると、音程で1/2(1オクターブ下)、速度も半分になる。 もとの38cm/毎秒のテープ速度に戻すと、音程は1オクターブ上がり、速度は2倍の元の 速度に戻る。  ところが声が「あのような」声に変化してしまう。普通はどんなに「ハイトーン」で がんばっても、声帯、口腔、鼻腔のサイズは変わらないので、ホルマントはあまり変化 しないが、テープ速度で1オクターブ上げると、ホルマントごと1オクターブ上がってし まうので、「ミニチュアな人」の声になってしまうのである。(ホルマントについては vocorderの項を参照)  audacityでこの効果を得るには、 1)プロジェクトのサンプリング周波数を(仮に)48KHzとし、 2)ガイドを作成、歌以外のパートを作成 3)ガイドと歌をうたうのに必要なパートのトラックのプルダウンメニューを開き   「レートをセット」の「その他」に24000Hzを入力  *プロジェクトのサンプリング周波数などを変えても「テープ速度」変化は得られな  い 4)これで「テープ速度」が半分になったので、歌を(あるいは楽器演奏を)録音 5)24000Hzに変えたトラックのサンプリングレートを、元の48KHzにもどし、   新たに録音した「歌」トラックは、プロジェクトのサンプリング周波数である48KHz   で作成されるので96KHzに変更し、ミックスなどの処理を行う・・・  上記の例は「変な声」にすることが目的なのでこれでよいが、速く正確な演奏にしよ うとしたら楽器までミニチュアになったのではかなわない。(テープ速度を遅くして、 そのパートを録音し、元の速度で再生する場合) ☆☆速度が半分になるので、理論上2倍の速度で演奏できるようになるし、同じ速度なら  2倍の精度(?)で演奏できる。しかし、速度や演奏精度を上げるためにはオクターブ  もの速度ダウンは必要ではなく、一般的に3〜4度程度の速度ダウンで十分にその役割  を果たす。 ☆どれくらいまでのテープ速度変化なら「変な音」にならずにすむか。  楽器にもよるが、「声」は比較的変な声になりやすい。この原因は、「声」が日常的 になじみが深く、また脳がホルマントの変化にとくに敏感だからである。  通常の楽器では長±3度(±400セント)程度、(楽器やパートによっては±500セント 〜700セント)程度が限界になるだろう。実際に行うとわかりやすい。 **下記にオクターブ以外の変化を得るのに便利なように、音程/サンプリング周波数の  対応表を掲載した。上記の手順のように「遅くして録音」したら、録音したトラック  は「その分速く再生」する必要がある。例えば長3度下げるにはサンプリング周波数を  38097.63Hzに変更し再生・新たなパートの録音を行い、もとの戻すには長3度あげなけ  ればならないが、そのときのサンプリング周波数は60476.21Hzである。  ピタゴラス律で行うなら、それぞれ38400Hzと60000Hzのサンプリング周波数になる。 ☆変更音程度数(セント数)とサンプリング周波数の計算方法(平均律)  セントとは調律用語で、平均率1半音の1/100を1セントとする。1オクターブは12半音 なので、1200セントとなる。  1オクターブは周波数比2倍なので、1半音や1セントを求めようとすると、べき計算が 必要になる。1半音は1オクターブの1/12なのだが、そもそも1オクターブとは「周波数比」 という等比級数なので、その1/12は  1半音=2^(1/12)≒1.059463094(単位は倍 ) となる。関数電卓では「2」「yのx乗(yの右上に小さくxと書かれたキー)」「(」「1」 「÷」「12」「=」と入力すると得られる。  と、言ってもどのように使用すればよいのか分かりにくいので、具体的には・・・    A=440 Hzのときに 1半音上=A♯=440X1.059463094=466.1637615(Hz)  同        2半音上=B=440X1.059463094X1.059463094=493.8833013(Hz)  同様に半音数だけ1.059463094を掛ければよい。電卓を使用する場合はこの数を、メモ リーにメモしておけば、リコールするだけで使えるので便利だ。 もちろん12回掛ければ、オクターブ上の880Hzになる。  サンプリング周波数に適用するには同様に  48000Hzのトラックを1半音分上げるには 48000X1.059463094=50854.22853(Hz)  逆に1半音分下げるには 48000÷1.059463094=45305.96701(Hz) となる。  12回この数で割れば24000(Hz)が得られる。 *サンプリング周波数の場合は小数点以下を四捨五入してしまえばよいだろう。 **参考までに平均率と純正律の各音程分のサンプリング周波数を表す。 セント数 サンプリング周波数 度数 純正律完全系サンプリング周波数 セントエラー | | 速度% | 周波数比 | 速度% | | | | |     | | |  | +1200 96000 Hz 200% 8度 +1oct, 2/1 96000Hz 完全8度 200%    0 +1100 90611.93Hz 188.8% 7度 +1000 85526.28  178.2% 短7度 +900 80726.06Hz 168,2%  6度     5/3 80000Hz    166.7% -15.6 +800 76195.25Hz 158.7% 増5度    8/5 76800Hz    160.0% +13.7 +700 71918.74Hz 149.8% 5度    3/2 72000Hz 完全5度 150.0% +2.0 +600 67882.25Hz 141.4% 増4度 +500 64072.31Hz 133.5% 4度    4/3 64000Hz 完全4度 133.3% -2.0 +400 60476.21Hz 126.0% 長3度    5/4 60000Hz    125.0% -13.7 +300 57081.94Hz 118.9% 短3度    6/5 57600Hz    120.0% +15.6 +200 53878.18Hz 112.2% 長2度 +100 50854.23Hz 105.9% 短2度 0  48000 Hz  100% 同音(1度)   1/1 48000Hz     100%  0 -100 45305.97Hz 94.39% 短2度 -200 42763.14Hz 89.09% 長2度 -300 40363.03Hz 84.09% 短3度    5/6 40000Hz   83.33% -15.6 -400 38097.63Hz 79.37% 長3度    4/5 38400Hz     80.00% +13.7 -500 35959.37Hz 74.92%  4度    3/4 36000Hz 完全4度 75.00% +2.0 -600 33941.13Hz 70.71% 増4度 -700 32036.16Hz 66.74%  5度    2/3 32000Hz 完全5度 66.67% -2.0 -800 30238.11Hz 73.0%  増5度    5/8 30000Hz     62.50% -13.7 -900 28540.97Hz 59.46%  6度    3/5 28800Hz     60.00% +15.6 -1000 26939.09Hz 56.12% 短7度 -1100 25427.11Hz 52.97%  7度 -1200 24000  Hz  50%  8度 −1oct, 1/2  24000Hz 完全8度 50%  0 ○注)先の例ではテープ速度を半分にしたので−1オクターブちょうど音程が変化したが、 上記の表を用いて、完全4度下げた場合は4度下げて演奏をしなければならない。演奏と 録音が終わったら、下げたトラックと録音したトラックを4度上げなければならない。 ☆ 簡単な平均律と純正律の解説・・・実践における問題  洋の東西を問わず、ほとんどの地域の音楽(古来からの)において、基準となる音の 高さに対するオクターブの概念は普遍性があると言える。これは物理学上の「すわりの 良さ」と「心理的心地よさ」が両立されるからだが、オクターブ内をどのように分割す るか(あるいはオクターブ内にどれだけ音を設けるか)となると、一致は困難となる。  同じ西洋音楽において、12の音名ではあっても、古来からの純正律とバッハ以降普及 したとされる平均律の間にも明確な違いがあり、上記のような操作を行う場合でも、 どちらを採用するか悩みは深い。(オクターブなら何の問題もないが)  たしかにピタゴラスの時代には、すでにこの「音楽現象」の解析は純正律の数学的解 明にまで及んでおり、ピタゴラス律(あるいはピタゴラス音階)として、以降の音楽研 究にも多大な影響を及ぼし続けてきた。そもそも音楽芸術たるゆえんはその「調和」に ある。 音楽を構成する要素の中で時間構造を伴わない調和として、各音の高さにおける「協和」 がある。音階そのもののとり方にもこの協和はあるが、単純に分かりやすいものとして、 和音(ハーモニー・・ハーモニーは単純に和音の響きをあらわすものではない。また和 音という時間断面の考え方は、鍵盤楽器の隆盛によるもの)の協和があるが、本来の協 和とはコーラスや弦楽合奏(音程そのものをリアルタイムで作らねばならない楽音によ る演奏)などで「ハモった」状態を指す。  その状態を「美しい」とするが、その状態を検証してみると、協和しているときに、 その「各構成音の周波数比が単純整数比」になる、というのである。2音の和音で、それ ぞれの音をL/Rに配置しリサージュ(リサジューとも・・業種により呼称が異なる)を見 ると(WaveSpectra.exeなどで)単純整数比のときには、確かに美しい立体図形が現れる。 もちろん聴いても美しい。***単純整数比の例として完全4度があるが、周波数比は 3対4になる。***  ポップスの分野で、いわゆる「**メタル」というロック音楽の分野があるが、この 分野の音楽家には完全主義者が多く、音階においても単純整数比を追及する傾向がある。 もちろんロックなので、エレキ・ギター、エレキ・ベース、ドラムス、歌などで構成さ れることが多いが、独特のワイルドに歪んだギターの音で美しい歪みを得るために、 チューニングした弦が狂う事を嫌い、ボルトで固定し、あげく完全4度、5度の和音(・ ・・パワーコード)だけで構成せざるを得ない・・。つまり4度5度は上表にあるように 平均律(ギターのフレットは本来平均律)と純正律の差が少なく完全性を追求しやすい わけである。3度は不純なわけだ。この理由でキーボードの加入を許さないバンドは多い。 そのサウンドは3度が出現しないため短調なのか長調なのかすらわからない。そもそも彼 らにはそれすら不純なのかも知れない。  平均律の実用化はバッハの時代以降とされ、オクターブの中に12の音名しかないのに、 事実上の音程が12に集約できない・・・例えばド−ミ−ソ−ミ−ドと歌ったときに、上 行と下行でミの高さが異なることは鍵盤ではありえないし「一神教」的に不条理とする 考え方があり、それを解消するのにオクターブを均等に12分割するという「合理性」に 基づくものとして普及してきた。しかしオクターブの12均等割りは「2の12乗根」であり (上表参照)汚い響きになってしまう。ピアノの調律ではこれを解消するための各種の 調律方法が考案されてきたが、一般には普及していない。  純正律は「美しい」が、数学的単純さと同時に数学的矛盾も内包している。その最大 の問題は、「ピタゴラスのコンマ」と呼ばれるもので、 完全5度ずつ12回上がると7オクターブ上の同名音になるはずである。完全5度の周波数比 は2:3(=1.5倍)なのでその12乗は129.74633789・・・倍となり7オクターブ上の128倍 と一致しない。セント数にして23.46セントの誤差が生じる。 <注釈>そもそも数学的サポートのもとで純正律は生まれたわけではなく、美しい響き を分析してみるとその中に数学的単純整数比が見出せた、という観察者的論理にすぎな いことに注意すべきだ。「そのようになっていなければならない」というものではない。 また平均律が鍵盤楽器的で汚い響きになっていることもまぎれもない事実であり、「み んながやっているから・・」とか「MIDIではやりにくい」などと、責任転嫁していると 次第にその怠慢は他の要素にも伝播し、やがて「美しさ」を失ってしまうだろう。美し くない物に対しては誰もお金を支払ったりはしない。 ○ ポップスにすら見られる矛盾  例えばギターのチューニングがあげられる。 ギターという楽器を手にしたことがある者なら、そのチューニングを行ったことがある はずだが、その方法は大別して3つある。  第1の方法はチューニングメータで各弦をそれぞれメータ指示に従って合わせる方法だ が、チューニングメーターの大部分は平均律になっているため、チューニングも平均律 になる。  第2の方法はA音を音叉やチューニングメータの発する音を頼りに、各弦をハーモニク スで合わせる方法。  第3の方法はA音を音叉やチューニングメータの発する音を頼りに、各弦を指板を押さ えながら合わせる方法。  この3種の方法はどれも結果が一致しない。 第1の平均律と第2の純正律チューニングを比較してみよう。 弦 音名  周波数比(対A純正律)周波数   周波数比(対A平均律) 周波数 1 E (3/2)X(2/1)=6/2=3 1320Hz +1900¢=2.997 1318.5Hz 2 B (3/4)X(3/2)X(2/1)=18/8=9/4 990Hz +1400¢=2.245 987.8Hz 3 G (4/3)X(4/3)=16/9 782.2Hz +1000¢=1.782 784Hz 4 D 4/3 586.6Hz +500¢=1.335 587.3Hz 5 A 1 440Hz 0¢=1 440Hz 6 E 3/4 330Hz -500¢=0.7492 329.6Hz *純正律調弦の手順は、まず音叉またはチューニングメータで5弦=A=440Hzを写し取り、 次に4及び6弦をハーモニクスで合わせる。次いで4弦から3弦をハーモニクスで合わせ、 6弦から1弦を合わせる。さらに1弦から2弦を合わせるが、私の場合は1弦を合わせるのに 6弦からではなく、5弦から5度の協和で、同じく2弦は6弦からの協和で合わせる。 (もっとも私の場合、6弦、4弦もハーモニクスではなく5弦との協和で合わせているが、 協和もハーモニクスも原理的には同じ調弦になる)  この手順を整理すると、 音叉→5弦 copy2 5弦→6弦  5弦→4弦  5弦→1弦 copy3 1弦→2弦 または 6弦→2弦  4弦→3弦 となる。 copyとはハーモニクスまたは協和を用いて音程を複写することであるが、ハーモニクス または協和を用いてcopyすると、1回のcopyあたり「ピタゴラスのコンマの1/12」=約 2セントずつ誤差が蓄積し、2弦、3弦は合わせづらい。4セントの誤差は決して小さくは ない。  解説が長くなったが、音律はこれほどまでに根が深く面倒で、また美しいことは分か っていても純正律は容易には実現しにくい。しかし聴感との整合性と数学的矛盾を考え ると平均律への一元化にも問題がある。  結論から述べるとサンプリング周波数の設定において、純正律数列と平均律数列の どちらを選択するかは、その目的と使用者が何を求めるかによって決めるしかないと言 える。audacityはそのどちらにも対応する。 ☆ポップスなどで「変な音」以外の応用はあるのか  様々な場面で一人の演奏者が、複数のパートを兼任で演奏する場合がある。これは マルチ録音では演奏の同時性が希薄なため、大勢で同時に演奏しようと、一人が1パート ずつ順番に演奏しようと、ミックスの手間としては変わらないばかりか、同時に一つの 空間で演奏すると、それぞれのパートがそれぞれのマイクにクロストーク(いわゆる 「かぶり」)が生じ、ミックスしにくいが、むしろ、個別に録音されている方が、トラ ックごとの分離が良いためミックスは容易になる。(音楽的整合性は悪化するが)  ところが、コーラスにせよ楽器演奏にせよ、一人の演奏者が「多重録音」的に行うと、 同じパートなら本来の目的である厚みが増えず、異なるパートであっても2人分の演奏 にはならない。現場ではこのような不可解な現象を「近親婚」だとか「劣性遺伝」だと か言うが、原因は「同じ癖」「同じ解釈」「同じ思考」にある。同じホルマントも原因で ある。どれくらい近似なのか調べたことがあるが、ベースや歌では「位相レベル」で同一 になることすらある。背景のノイズや楽器の疲労が異なるだけだ。人間の演奏能力とは そのような精度を持っていることは驚異的であるが、もちろん下手な演奏者ではそこま での一致は無い。しかしそこまでの一致が無くても、やはり厚みが増えないという問題は あり、また「コーラス」「オートチューン」などのエフェクトで逃れることは邪道だ。    このようなときに2度か3度分ずらせた速度で(変な音にならない程度)、2度目以降の 録音を行うと厚みがでることが多い。これは楽器の場合は運指や思考が変化し、またホル マントも移行するために、そのことが音の厚みにつながるからと考えられれる。管楽器の 場合はB♭管とC管を使い分けたりする。 ○ audacityには「ピッチの変更」や「時間軸のスライド/ピッチの変更」があるのに、  なぜそれらを使用しないのか。  結論から先に記述すると、サンプリング周波数を落として演奏録音を行い、もとの サンプリング周波数に戻すことによって得られる効果と、上記の「ピッチの変更」などで 効果で得られる効果は、その結果も意味も異なる上に「制作の楽しさ」が違う。また、サ ンプリングレート変換による損失以外の損失はこの古典的方法には無いが、「ピッチの変 更」や「時間軸のスライド/ピッチの変更には、アルゴリズム上相当の損失があり、電子 音楽的完全性の達成には障害となる。  しかし筆者はこれらの新しい「効果」を否定したいわけではなく、それにふさわしい 使い道を模索すべきであると提案したいのである。つまり古典的手法の「手軽な代用」 として使用する限り、古典的手法を上回る結果は得られないからだ。 ○ MIDIなどでシーケンス制御された、サンプリング音を高品位に再生(演奏?)する。  サンプリング音源は様々な形で作成され、現在ではMIDIサンプリング音源はあまり用い られず、ソフト音源が主流になりつつある。サンプル音そのものの作成・収録方法は様々 で、ROMに焼き付けられたメーカー製品であっても明確に違法に収集されたものもあった りする。(筆者の知り合いにもその被害者がいるが、オリジナルとROMデータは波形レ ベルで一致する。真に著作権フリーなどというものは存在しない・・余談)  サンプリングの品位の問題だが、音源の多くは使いまわしで、ハードウェアのスペッ クはさておき、実際には帯域(高域特性)が狭く、アンチエリアシングも低いことが多 い。 (アナログ・シンセサイザー音源は広帯域であることが多い)このためそれらが混在す るミックスでは音の整合性が悪く、つまらない音になることもしばしばであるが、この 問題を解消するために、サンプリング音源を録音するときにサンプリング周波数(テー プ速度)を一定量(3〜4度分程度)下げて、(もちろんトランスポーズでシーケンスデ ータもその音程分下げ)作成し、もとの速度で再生するとそのサンプリング音源の音が 「ヌケの良い」品位の上がった状態で扱うことができる。  これは、普通にサンプリング音源を再生した場合、もとのサンプリング周波数に対応 したアンチエリアシング(LPF:ローパスフィルタ)が設定され、それを変更することは できないが、この手法を用いると、20%〜30%サンプリング周波数が上がった(当然ア ンチエリアシングも同様に)状態に相当し、品位が向上したように聴こえるのである。  しかしaudacityにはMIDI同期に機能がないので、MTC→FSKのコンバーターなどをもち いて他のマシンのシーケンサーと同期させる必要がある。 ○ 外部リサンプル・エンジン  audacityはサンプリング周波数の違いを意識することなく、様々なオーディオファイ ルを同時に開くことができるが、「サンプリング周波数1」項で触れたように、プロジェ クトのサンプリング周波数と開いたファイルのサンプリング周波数が異なる場合や、コ マンドとしてのリサンプルを使用した場合に、相応の劣化がある。前項で触れたように、 最たるものとしては「折り返しノイズ」や「拡散」などであるが、確実に音色の変化と して現れる。  一般的な編集やマルチ録音ではあまり問題にならない程度ではあるが、マスタリング や測定などの分野では致命的かもしれない。また主題である電子音楽への応用ともなる と純音(正弦波)の純粋性をとやかく論じるため、無視はできないだろう。  CD出版などの録音制作の分野でも、最初から44.1kHzサンプリングで録音することは 少なく通常48kHzや88.2kHzで録音編集などを行い、最終的に44.1kHzに変換することが 多い。  このような場合、どのようにサンプリング周波数の変換を行うかは大問題であり、筆 者の場合、最終的にはヒアリングによって手法を決定しているが、選択肢は多いほどよ い。 その選択肢のひとつとして「late_brainr(8brain.exe)」を推奨したい。「そのほかの 有用なソフト」項を参照。 <R8brain.gif を参照>  このソフトは浮動小数点に完全対応で、折り返しノイズも大変優秀といえる。測定用 途にも十分耐えられるが、特性が優秀だからといって、音色が無変化というわけではな い。筆者の業務のひとつである「マスタリング」において、サンプリングレート変換は、 比較的に頻度の高い作業だ。工程としてはサンプリングレート変換が最後のに近い(最後 には絶対にならない)工程で、一度だけ使用されるようにスケジュールするが、どういう わけか、性能を示す特性数値と採用結果が全く一致しない。最近4年間依頼を受けた作家 の全てが、ソフトによるレート変換を選ばなかった。(48KHz→44.1KHzについて)歪やあ る種の変質があることを許容しながら、チップ・ハードウェア(オーバーリサンプリング) による変換を指名していることは、大変興味深い。 扱うソースによってはaudacity標準装備のリサンプルが最も良いこともしばしばある。  またリサンプルする場合も「2のn乗則」は当てはまり、いくつからいくつへの変換な のか、も問題を複雑にしている。