ソフトウェアシンセサイザとは

 ソフトウェアシンセサイザとは、コンピュータ上で作られたシンセサイザのことである。
現実に存在するシンセサイザをソフトウェア上で再現したものや、ハードウェアでは容易でないアルゴリズムの新たなものなどが存在する。

 その能力はCPUの能力に依存するが、CPUの能力しだいで無限の可能性を秘めている。

 ソフトウェアシンセサイザが存在し始めたのは、CPUのクロックが100MHz程度まで上がった頃だとされる。
現在、ソフトウェアシンセサイザを有効に活用すれば、一台のPCだけで楽曲製作を完結させることができる。
ただし、その場合、CPUの性能やDSPの能力に大きく左右される。

 また、演算によって音を作り出すため、どうしてもノートが入力されてから音が出力されるまでのレイテンシが発生してしまう。
そのパートだけ録音して使用する場合であれば、特に問題ではないが、製作中やソフトウェアシンセサイザ以外の音源とセッションする場合にはそのレイテンシが大きな問題になる。
キーボード等で演奏をする、ということも難しくなる。

 そこでリアルタイムに(正確には非常に小さいレイテンシで)出音をモニタリングする技術、ASIOが開発され、現在ソフトウェアシンセサイザだけに関わらずオーディオシーケンサでもこれを使ったリアルタイムモニタリングが実装されている。

 現在においてはPCのスペックが高くなっているので、ソフトウェアシンセサイザは今日の楽曲制作シーンに無くてはならないの機材・楽器となっている。

シンセサイザの構成

 一般的なシンセサイザは、オシレータ、フィルタ、アンプリファによって構成されている。
オシレータによって基本となる音波を発振し、フィルタを通してその音波を加工し、アンプリファによって増幅する。
通常はこれにADSRモジュールというAttack、Decay、Sustain、Releaseのそれぞれのパラメータをコントロールするためのモジュールを各所に接続する。フィルタに接続すればフィルタの効き具合を、アンプリファに接続すれば音の出方をコントロールできる。
このADSRの一部にオシレータを接続してパラメータ値を連続的に変化させることで音を時間軸で変化させるといったこともできる。このとき、使用されるオシレータのことを一般にLFO(Low Frequency Oscillator )と言う。
フィルタはその特性により4つほど種類がある。

最もよく使われるフィルタはローパスフィルタである。
また、カットする周波数をコントロールするパラメータを一般にカットオフ、カットオフ付近を強調するEQの一種をレゾナンスと呼ぶ。
このカットオフとレゾナンスを使うことで音に独特のキャラクタを出すことができる。

 音のキャラクタは、前述のフィルタを用いるほかに、オシレータが発振するもとの音波の波形によって決定される。
オシレータはプログラムによって様々な波形の音波を発振する。
波形は以下のようなものがある。

等々がある。

 また、これらの波形を複数のオシレータを使うことで重ねたりすることもある。

 理論上はこの波形を組み合わせたりしていけばどんな音でも作ることが可能である。

 現在多く使用されているDSPを用いたシンセサイザでは、従来物理回路で行っていた以上のようなアルゴリズムをソフトウェアで行い、多くのプログラムを一つのシンセサイザ上で動作させることができるようにしている。このタイプのシンセサイザとソフトウェアシンセサイザはシンセサイザをプロセッサ上で再現することから非常に近いものだ言える。

シンセサイザの種類

 現在、PCなどで一般的に使われているMIDI音源というのは大抵が PCMシンセサイザの類のものである。これは、元となるサンプリング音に音の質が左右されるため、サンプリングされた素材の質によってはどうしようもない音になったり本物の楽器の音と区別がつかないほどのサラウンドを再生することができるものまで存在する。一般的に音質と値段は比例することが多い。

 また、シンセサイザは二つの分け方をすることができる。
一つは信号をアナログで処理するアナログシンセサイザ。
もう一つは信号をデジタルで処理するシンセサイザ。
アナログの場合、部品の質によって音が変化したり場合によっては動作が不安定になることがある。
デジタルの場合、アナログのようなことは無いが逆に音の揺らぎが少ないため楽器としての面白みにかけることがある。
そのため、DSPシンセサイザにはアナログシンセサイザのアルゴリズムをDSP上で再現して発音する、アナログモデリングシンセサイザというものも存在する。また、シンセサイザではないが、同じ技術をエフェクタにも応用した製品も数多く存在している。

ソフトウェアシンセサイザの利用

 前述のとおり、ソフトウェアシンセサイザはそれを動かすPC環境によって性能が左右される。高性能なシンセサイザであると、推奨される動作条件が高くなり、それ以下ではまともに動作しなかったり同時発音数が減ったりする。
また、PC環境でソフトウェアシンセサイザだけを動かすということはあまりなく、大抵ミュージックシーケンサやソフトウェアシンセサイザのホストとなるプログラム、エフェクトプラグインやその他のプログラムを動かすことが多いためソフトウェアシンセサイザに回せるハードウェアリソースというものは限られることになる。

 常に最先端のPCハードウェアを用意できれば特に問題もないわけだが、普通そんなわけにはいかない。大抵は1(または複数)トラックずつ録音してハードウェアリソースを節約しながら楽曲を製作することになる。

 そのような状況を改善するために、現在ではソフトウェアシンセサイザを専用のDSPやハードウェアで処理することや、ネットワーク上のPCのリソースを利用して負荷を分散させるソフトウェアなども存在する。要は音楽のためのクラスタを利用するのである。この方法を用いれば、安価に手に入るPCを大量に購入して無限のソフトウェアシンセサイザを利用することができるわけだ。ハイエンドのワークステーションはもう必要ない。

 ソフトウェアシンセサイザには、いくつかの規格が存在する。
私が利用したのはSteinberg社の開発したVSTi(Virtual Studio Technology Instrument)という規格で、現在最も多く使用されているであろう規格である。インターネット上には無料のVSTiも数多く存在し、十分な性能のものも少なくない。
そのほかには、Windowsで使用できるDXi(DirectX Instrument)や、DP用プラグインであるMAS、MacOSXで使用できるAudioUnit、などなどが存在する。
また、スタンドアローンで動作するものもある。

オーディオファイル形式

 研究の一環として楽曲を制作するわけだが、シーケンサに打ち込むのはMIDIである。制作環境とまったく同じ環境が再生する環境にあればそのままでも問題はないわけだが、そのままでは非常に扱いが面倒である。何しろシーケンサをわざわざ起動しないといけない。また、MIDIで打ち込むといっても再生時にPCのリソースの関係上大量のソフトウェアシンセサイザを動作させることはできない。そこで、できたトラックからWaveファイルに録音して、MIDIの替わりに再生させる。

 複数人で楽曲を制作するときには、各パートを録音したファイルを何らかの手段で受け渡すわけだが、現在ではそれにインターネットを利用する事が多い。そのとき、Wave(Aiff)ファイルで受け渡しをするのは非常にナンセンスである。そこで多くの場合、受け渡すファイルを圧縮する。楽曲の製作中であるため、圧縮によって生じる音の劣化は最小限にしなくてはならない。

 圧縮方式には大きく分けて2つのタイプがある。
一つはデータの劣化が無い可逆圧縮。もう一つがデータを劣化させてサイズを落とす非可逆圧縮である。

 ここで使用するのは可逆圧縮である。よく利用されるのが、Monkey's Audio(.ape)である。

 一方、非可逆圧縮には、Mpeg1 Audio Layer-3/Mpeg2 Audio Layer3(.mp3) 、OggVorbis(.ogg)、AAC(.m4a)、RealAudio(.ra)、QuickTimeAudio、Windows Media Audio(.wma)などが存在する。

 また、最終的に楽曲をリリースするときには、まず、Wave(Aiff)ファイルに録音して、マスタリングするが、そのままでリリースするわけにはいかない。

 CDに焼くならばWaveのままディスクイメージを制作すればよい。

 Webやゲーム中で使用する場合は大抵非可逆圧縮を行いファイルサイズを小さくする。前世紀はMP3が非常に流行したが、MP3はライセンス関係の問題や音質などの問題がありあまり使用するべきではない。 現在ネット上で活動中のアーティストやゲームで使用されつつあるのが、OggVorbisである。OggVorbisはGPLで音質も同ビットレートのMP3より格段によい。 また、Mpeg4の音声圧縮技術であるAACもApple社や着うた等によって広く普及しつつある。

 かういう私が使用するのはOggVorbisとAACであるが、いまだ多くのサイトではMP3で公開しているのでMP3も多くストックしている。また、サイトで公開しているファイルは現在OggVorbisのみである(古いファイルの一部は未だMP3ではあるが)。

 圧縮されたファイルを再生するには、一般にそれに対応したプレイヤが必要になることが多い。また、ファイルは圧縮されているため再生するにはデコードする必要がある。このデコードの精度によって音質が変わるためプレイヤによって音質が変わるのである。このデコード処理は本体では行わずプラグインで行うプレイヤも存在する。このタイプのプレイヤの場合、プラグインを追加すればそれだけ色々なファイル形式に対応できることになる。その代表的な例としてWinampがあるが、現在このWinampの最新版であるWinamp5は上記の3つのファイル形式に対応している数少ないプレイヤの一つである。

研究過程

 前半に行ったソフトウェアシンセサイザの製作は、SynthEditというソフトウェアモジュラーシンセサイザを利用して行った。

 これは、シンセサイザのモジュールを繋げてユーザーの好きなようにシンセサイザを作ることができるという画期的なソフトである。同じようなソフトに、国産のVOID Modular Systemや、NIのREACTORなどが存在する。

 研究の流れは、基本的に既存のシンセサイザの構成の理解のために一つずつステップを踏んでいくものであった。そして、理解をしたところから実際に制作するモジュールに組み込んでいった。

 まず行った実験は、オシレータとアンプリファを繋げて実際に音が出る様子を見た。この実験はすぐに終わり、引き続きオシレータとアンプリファの間にフィルタをかましてフィルタのかかり具合による出力波形・音の成分をスコープ・フリケンシアナライザで確認した。

 次に、ADSRモジュールをフィルタ・アンプリファに接続しADSRの値によるノートオンからの音の立ち上がりやノートオフしてからの音の残り具合などをいろいろと試してみた。基本的なシンセサイザの構成はこの時点で理解したことになる。

 ここからは、FMシンセサイザ、フェイズディストシンセサイザ、オルガン、スーパーウェーブシンセサイザなど、主要なシンセサイザの形式の基本的なアルゴリズムを再現し、また、ある程度使えそうなパッチの製作を行った。

 FMシンセサイザでは、フィルタを効果的に使い、管楽器系の音色を作り出すことに成功した。フェイズディストオシレータはシャープな音を出せることから、普通のオシレータとともに使用し、二つ(あるいはそれ以上)の音をミックスして使えそうな音に近づけるためいろいろと試行錯誤をしてみた。その途中でLFOの使い方を習得してみた。トレモロからトライしてみたが、トレモロが一番その効果を発揮させるための調整が難しかった。

 後半はソフトウェアシンセサイザを利用した楽曲の制作である。

 一曲目「Monophonic Love」では、ソフトウェアシンセサイザを利用した楽曲の制作である。時間が多くあるわけではなかったのと、SynthEditで制作したソフトウェアシンセサイザの一部が使用していたシーケンサでうまく動作しなかったことから、フリーのソフトウェアシンセサイザを利用して楽曲を制作した。

 使用したシンセサイザは、

の三種である。

 PCのCPUパワーとシーケンサの使用の都合から普通のMTRのように1トラックずつ録音していき、最終的に波形をミキサーでまとめて録音した。

 音作りでは、SUPERWAVE P8のLFOでフィルタの係り具合を周期的に変化させてみたり、Synth1のアルペジエータでランダムなシーケンスを足してみたりしてみた。これにより、曲のスピード感を増やした。

 ベースラインはレゾナンスを弄って少し癖のある感じに、メインメロディーはサイン波とノコギリ波を重ね、よく通る音にした。

 また、インサーションや波形編集時にエフェクトをかけて音の調整をした。

 2曲目「fly」では、ソフトウェアシンセサイザだけでなくマイクからの録音・ハードウェア音源の使用も行い、通常の制作スタイルとほぼ変わらない制作を行った。

 ただし、著作権・著作隣接権の関係により、作詞・実演を外注することはしなかった。

 また、この楽曲では自作したVSTiを使用した。
使用した機材は

である。
それぞれ、ボーカル用、ミキサー、ハードウェア音源、VSTiオルガン、VSTiスーパーウェーブシンセサイザ、VSTiFMシンセサイザである。

 この楽曲はBS5制作のゲームの主題歌と言うことなので楽曲の長さを約1.5分にして、それにあわせた動画も制作している。この動画も著作権・著作隣接権の関係から原画やグラフィックを外注するといったことはしていない。

 動画、といってもよくあるMADやAVGのOPのようなノリで制作しているので、基本は静止画を動かして文字を流して、といった感じである。深く突っ込んではいけない。

 また、これと関連してBS5にはゲーム画面へ入る前のよくあるタイトルムービーのようなものも提供した。これはBS5の使用するPCに入っていたソフト(Flash5)を使用して作ったもので6秒あまりの短いものである。
たった6秒あまりの音声なしの動画ですら、AVIファイルであると50MB近くになったため、WMVにエンコードしてみたところ1MB弱にまで圧縮された。

 動画制作に使用したPCのスペックは低かったので重いエフェクトをかけたりすることはできなかったが、制作時間や(動画自体には数時間程度もかけていない。それに使用する素材の製作に時間が掛かり過ぎたが)経験値(実際、殆ど初めてですが何か?)のわりに、ある程度のものは作れたのではないかと思う。知人のFla師の足元にも及ばないが。