Audacity、Vocalshifterの解説書を発行公開して半年が経過しましたが、その間様々な反応やご意見をいただき、ありがとうございます。当初はあくまで専門職向けの私個人のノート公開であったものが、リクエストや近年の動向から、想定していた範囲よりも広い層に向けたものに変化してきました。とくにポップス分野には見向きもされないだろうと思っていたのですが、最初の目標であった電子音楽分野よりも、商業ベースやそれを目指す人たちの反応の方が大きく、筆者にとっては意外な状況となっています。

 また、様々な環境の読者さんがいらっしゃるようで、とくに音源に恵まれない人たちからは、オリジナルの音源公開などのリクエストも多いのですが、私の本業は商業ベースの制作者であり、古いものであっても公開できるものは極めて限定されていますし、関係者に許諾をとることも困難です。

 そこで、ある程度の制限はあるものの、個人での自由使用が認められているソースがあるようなのでそれを使用し、解説書では説明しきれない部分を「実習」に見立てて補ってみたいと思います。

*本書の作業は世に無数に存在するDAWの中でも、Audacityがもっとも得意とする作業であり、同時に優位性のある作業とも言えるものです。この作業での作業品質は、それ以降のすべての工程に甚大な影響をおよぼし、最終的な品位をも支配しかねないものだからです。Audacity以外にご贔屓のDAWがある方にも、この作業にAudacity を使用することを推奨します。また、その優位性が信じられない方には、比較検証を行ってみることを強く推奨します。

実習の流れ・・・
1)ソースの入手(ダウンロードなど)
2)伴奏(カラオケ)の読み込み
2-B)伴奏トラックのレベルの適正化
3)歌の読み込み
3-B)歌トラックの時間位置調整と接続
4)伴奏のファイル書き出し
5)歌トラックのファイル書き出し


☆ソースの入手
 「THEiDOLST@GE」という企画団体が公開しているもので「夕暮れ~並木道~」という楽曲を使用させていただきます。以下のアドレス
http://zero-shaft.com/idol/top.html の「ダウンロード・ページ」にあるので、入手します。
 使用の制限事項はそのページに記述されているので、遵守しましょう。

歌とカラオケの両方が揃っているものは少ないのですが、「ユメのヒトカケラ 」 という楽曲もあります。こちらはソースにDCオフセットが乗っているので、そのことによって生じる問題を精査したり、修復復元することにも使用できるでしょう。

(筆者のところにマスタリングや様々な処理のために持ち込まれるソースにもDCオフセットはしばしば見られるが、除去の必要があるし、それによって生じたダメージは復元しなければならない・・プロフェッショナルマニュアルのトラブルシューティング[9]を参照)

  ダウンロードするとsong-sakuya-01.zip という7.62MBのZIP圧縮ファイルを受け取るでしょう。
このZIPファイルをダブルクリックすると、自動的に同名のフォルダが出現し

その中には、

 夕暮れ-オケ.mp3    カラオケ
 sakuya_intro.mp3     歌1
 sakuya_main2.mp3    歌2
 sakuya_main3.mp3    歌3
 sakuya_main4.mp3    歌4
 夕暮れ.txt         歌詞

 が入っています。


☆Audacityへの読み込み(ver,1.3.12として解説)
 Audacityはプラグインが入っていなくても、MP3ファイルを読み込むことができます(しかしLAMEプラグインが無いと、書き出しはできない)。まず、伴奏である 夕暮れ-オケ.mp3 をドラッグ&ドロップで読み込んでみよう。数秒で読み込みが終わり、波形が表示されたことでしょう。

*波形が表示されず、波形表示部分が斜線に覆われたままの状態の場合は、プロフェッショナルマニュアルの「トラブルシューティング」の[8]番を参照。

Audacityの「表示」→「クリッピングを表示」にチェックマークを入れよう。波形に多くの赤い縦線が表示されているだろう。この赤い線の部分が「クリップ(歪んでいる)」部分だ。このまま作業を続行すると、歪が固定化され、最終的な音の品位が低下するだろう。


 ○レベルの適正化
 トラック左側のサンプリング周波数表示あたりを左クリックすると、トラック全体の色が濃く変化し、そのトラックが選択される。
次に「エフェクト」→「増幅」を選ぶと自動的に「-1.6dB」という数値が、窓に代入されているだろう。そのままOKでも良いし、この-1.6dBを-3dB程度にするとさらにマージンが増える。次にOK。この窓の中の数値がマイナスの場合、「増幅」であっても、信号は元よりも小さくなります。


 この命令が実行されると、波形はわずかに小さくなり、赤い「クリップ表示」も消える。
<注>この作業は他の作業にさきがけて行っておくこと。Audacity ver,1.3.8以降では完全浮動小数点化されているので、「設定」→「品質」のビット深度設定を浮動小数点(32bit float)に設定しておくと、クリップで失われたはずの情報が復元する。もしこの部分が固定小数点(32bit float以外)に設定されていると(あるいはver,1.3.7以前の場合)、クリップされた部分の音情報は損なわれるだろう。


*この作業はクリップが著しい場合や、極端にレベルが低い場合には全ての作業に先行して行うように心がけたい。また、何デシベルの増減を行ったのか、メモをとるくらいの慎重さは欲しいところだ。このメモを取る習慣は、再現性の確保や学習(相場の取得)のために、有効なことだ。

同様にDCオフセットが著しい場合は、この時点で取り除いておくことが適切で、後になるほど補正や手直しが困難になるばかりか、切り貼りなどの編集を行うとパツパツノイズや、一瞬気絶などの症状があらわれる原因になる。プロフェッショナルマニュアル、トラブルシューティングの[9]を参照。


☆歌のトラックの読み込みと、時間位置調整
 歌のトラックは4個のファイルに分割され配信されている。読み込みは、ファイルをAudacityの画面にドロップするだけで開くことができる。
すでに伴奏のトラックが表示されているAudacity画面に、歌トラックを順番に次々に(それぞれのトラックが読み込まれるのを待つ必要は無い)放り込んでいくだけだ。放り込んで少し経つと、波形表示されたトラックが新たに4本(既に開いている伴奏のステレオトラックと合わせて、5本)のトラックが表示されているはずだ。(波形表示されない場合はプロフェッショナルマニュアル、トラブルシューティング[8]を参照)

この歌のトラックを読み込んで、そのまま伴奏と並べて両方再生しても、ズレのために正しく再生できない。トラックは本来次のようになっていると予想できる。
横軸を時間とすると・・・

 

トラックレイアウト図1
伴奏************************************
歌 _*1***___*2***____*3***____*4*****

 

のように歌の無い、伴奏のみの部分 ___は、歌のファイルから削除されている。
歌が無い全くの無音なので、無駄というわけだ。
読み込んだばかりの状態では以下のようになっている。

 

トラックレイアウト図2
伴奏************************************
歌 *1***
歌 *2***  
歌 *3***
歌 *4*****

 

とりあえず、歌のトラックを順番に並べ、形だけでもトラックレイアウト図1のようにする。
方法は
1)タイムシフトツールに切り替え(「⇔」またはF5)、sakuya_main2(3番目のトラックまたは2番目の歌トラック)を右にずらし、歌トラック1の後ろまでずらせたら、ボタンを離さずにそのまま上のレーン(歌トラック1)にドラッグする。


*もし上のレーンに波形が移らない場合は、歌トラック1をトラック選択(トラック左のサンプリング周波数表示あたりを左クリック)して、作業をやりなおす。

 

伴奏************************************
歌 *1***
歌 *2***  → →↑

伴奏************************************
歌 *1***   *2***
歌   

 

 2)2番目の歌トラックは、波形の無い抜け殻になっているので、もはや不要なのでトラック左上のX印をクリックしトラック消去。

 3)次のトラック以降も同様に、タイムシフトツールで、ずらせて、レーン越え合体を繰り返すと、トラックレイアウト図1のようになるだろう。
*それぞれの歌の間は「くっつけずに」、すきまを残しておくこと!

 VocalShifterで読み込み→同期再生するには、次のようにノーデータ部分も無音で埋め尽くしておかなければならない(そうしなければ同時同期再生できない)。

 

トラックレイアウト図3
伴奏************************************
歌 _*1***___*2***____*3***____*4*****

  ↓      ↓       ↓         ↓
歌 +*1***+++*2***++++*3***++++*4*****

(+は無音サンプル)

 

 しかし、伴奏のトラックのどの時間位置に歌を並べればよいのだろう。DAWによっては、専用のファイル形式の場合、その時間位置の情報が管理ファイルに書き込まれていて、読み込み時に自動的にあるべき位置に貼り付けられるが、ダウンロードしたファイルのどこを探しても、そのようなタグなどは無いので、ヒアリングをもとに最適な位置を見つけなければならない。
筆者がヨシとする、それぞれのファイルの開始位置を示してみたい。

 

 sakuya_intro.mp3     0秒5967サンプル
 sakuya_main2.mp3    42秒40066サンプル 
 sakuya_main3.mp3   2分07秒44012サンプル
 sakuya_main4.mp3   3分36秒01940サンプル


で、これをAudacityのラベル書式に従い表記すると

 

0.124331   23.895738    sakuya_intro.mp3
42.834716  109.055103   sakuya_main2.mp3
127.916916  194.790365   sakuya_main3.mp3
216.040431  261.885308   sakuya_main4.mp3

 

上記の数値をメモ帳にコピー&ペーストし、適当なファイル名でセーブしたものをAudacityの「ファイル」→「取り込み」→「ラベル」で読み込むと、それぞれのファイルの位置情報を示すラベルトラックがあらわれる。


*一度Audacityを起動し、適当にラベルを作成し「ファイル」→「書き出し」でラベルをファイル書き出しして、そのファイルをメモ帳などで書式観察してみよう。ちなみに1行目が空白だと、読み込めても情報は反映されない。

このラベルトラックに合わせて、タイムシフトツールでそれぞれの歌データをずらせラベルトラックの位置と一致するように調整する。一致したときには縦に黄色線が現れるので、そのときに左ボタンを離す。黄色線がでているときに位置精度は、+1サンプル/-0サンプルになる。1サンプルの誤差が出る可能性があるが、この用途では問題はない。

<<上記の数値は筆者がヒアリングによって決定した数値だが、おそらくは実際の録音時の時間位置よりもいく分、前より(画面では左より・・音楽用語では前ノリ)になっている。オリジナルの時間位置が「正しい」ように思えるかもしれないが、実際のポップスの制作では、オリジナル位置そのままでミックスすることは少なく、歌やソロがいく分先行するようにオフセット調整する。


 これはレーテンシーなどとは無関係に、70年代アナログ時代から使用されている技術で、このオフセット調整で、歌やソロの「表情」を調整する。ジャストで合っていることがベストに思えるが、この先行オフセットは実際の生演奏でも自然に存在し、演奏者の心理状態の表れともされる重要な現象だ。

 例えば、十分に演奏がこなれて、自信に満ちた状態では、ジャストかまたはわずかに先行する傾向があり、逆に曲がこなれておらず、自信がない、あるいは不安などの要素があり、集中が途切れている場合には、ジャストよりも遅れる傾向がある。ジャズなどの分野では、部分的に記譜されているよりも半拍、または一拍先行して演奏する技法も表現として確立している。

 歌やソロはポップスなどの分野において主役であり、「伴奏(お供)を率いている」のであり、逆はカッコ悪い!! また優秀な歌手はカラオケによる伴奏であっても見事に「率いて」くれるものだ。このあたりの事情が理解しにくい方は、動画でオーケストラの指揮者の様子を観察してみるとよいだろう。


 *どれくらい先行させるか
 あくまでヒアリングによって先行量は決定するが、5msec~30msec程度を目安とするとよいだろう。
[参考]デジタルMTRの時代以降は、MTRの機能として±両方のオフセットが機能として標準的に備わったので楽になったが、アナログMTR時代には+オフセット(遅れ)はともかく、-オフセットは一大イベントだった。テープリールを左右入れ替え、移動したトラックを再生しディレーした信号を別トラックに録音し再びテープリールを入れ替える・・・つまり進めたいトラックを逆回転で遅らせ録音し、さらに逆回転(つまり正回転)で再生すると進んでいるという・・・。おかげで、演奏を聴くだけでどれくらいオフセットすればよいのか、msec単位で読めるようになってしまったが。ある意味、職人芸でしょう。


 *何を聴いて決めるのか
 もちろん露骨にズレていては具合が悪いのだが、歌の場合このオフセットの量で、受け取れる歌い手の表情や心理が変化するので、その点に注意して聴き取ろう。といっても、その感覚は経験などによって育まれるものなので、いきなり表情や心理が読めるかどうか、筆者は保障できない。しかし、この現象そのものは心理学的に裏打ちされる普遍性を持つものなので、潜在的には万人にある感覚と思われる。


 Audacity ではタイムシフトツールにより、極めて容易にオフセット調整ができるので、様々に調整し聴きとって、自分の内観を行ってみるとよいだろう。最終的に頼るべきものはそれだけなのだから・・。
ちなみに筆者の決めた位置は、リバーブなどの処理を行い、伴奏とミックスした状態でベストになるように読んだものだ。


 ○歌トラックの合体と固定化
 歌トラックの位置調整が4つとも終わったら(よくわからなければ、筆者の推奨した時間位置で)、ファイル出力前に歌トラックの固定化をしなければならない。
*そのままファイル出力を行うと、とくに最初の歌の前の無データ部分が無音に変換されず、次に処理を行うVocalShifterでズレてしまい、伴奏トラックと同期再生できない。

 合体と固定化は、歌トラックをトラック選択し(トラック左側のサンプリング周波数表示部分あたりを左クリックすると、波形表示部分が濃く変色する)、Audacity画面上の「トラック」→「ミックスして作成」を実行すると、ブツ切れのトラックの無データ部分はすべて無音に変換され、単一トラック化される。
*くれぐれも全トラック選択またはトラック選択無しでこのコマンドを実行しないこと。実行すると、伴奏と歌はそのバランスで、トラックダウンされて、1つのステレオトラックになってしまいます。その状態になってしまった場合は、おちついてUNDOすることで、元に戻せる。


☆音声データの書き出し(VocalShifter用 16bitファイル)
 一回の操作処理でファイル出力する場合は、「ファイル」→「複数ファイルの書き出し」の画面で「ファイルの分離基準」→「トラック」、「書き出し形式」→「WAV16bit PCM符号あり」、「ファイルの命名」→「ラベル/トラック名の使用」「既存のファイルを上書き」のチェックを外し、もちろん書き出す場所を指定し、「書き出し」。

 2度に分けてファイル出力する場合は、それぞれのトラックをトラック選択し(トラック左のトラックサンプリング周波数表示部分あたりを左クリック)、「ファイル」→「選択範囲を書き出し」で、ひとつずつファイル出力を行う。

*単なる「書き出し」を実行すると、全てのトラックはミックスされ、一つのファイルしか出力されないでしょう。(もしAudacityの「編集」→「設定」→「取り込み/書き出し」のカスタムミックスが指定されている場合は、拡張された多チャンネルのWAVファイルが出力されるだろう)

後編につづく
後編VocalShifter編は近日公開