これだけバラバラのものを、どうして「ボカロ」という言葉で、混乱なく併存できているのか不思議なのですが、本稿では、「(2)そのソフトウェアを使って創作された歌」
と暫定的に定義して使用します。
次に、初音ミクです。初音ミクとは、クリプトン・フューチャー・メディアから発売されている音声合成・デスクトップミュージック(DTM)ソフトウェアの製品名、およびキャラクターとしての名称です【註1】
わかりにくいので、私なりに、エンジニアとしての定義を試みます。
初音ミクとは、
(1)コンピュータによって作成されたメロディを伴う音声と、
(2)コンピュータによって作成された人間のように動き踊る映像とからなる、
(3)「歌手」という設定のキャラクターで具現化される、マルチメディアのコンピュータ出力の一態様であって、
(4)コンピュータ等によって作成された音楽と併せて表現されるもの
と定義できると思います。
つまり、初音ミクとは、
(1)コンピュータがプログラムに基づいて行った演算結果を、
(2)マルチメディア(音声と映像)に変換して、
(3)デバイス(ディスプレイとスピーカ)にアウトプットしたもの
にすぎません。
なお、この初音ミクと同じ態様のアウトプットとして、現在36のキャラクターが存在しています。初音ミク「鏡音リン・レン」「がくっぽいど」「巡音ルカ」など、12年12月の段階で私が確認した範囲で、36あります。(以下、初音ミクは、これらのキャラクターの総括名称として扱います)
つまり「『初音ミク』とは、『映画』の一態様にすぎない」ーーこれで正しいはずです。
このようなメディアは、別段目新しいものではありません。アニメや映画も、つまるところ上記の定義で説明できます。
しかしこの説明では、単なる映画にすぎない初音ミクに対して、なぜ「愛しているよー」と絶叫する、興奮した聴衆が存在するのか? をうまく説明できません。
そこで、このテーゼに対して、技術面からのアプローチと、心理面からのアプローチを試みます。
●初音ミクを支える技術
まず、初音ミクをつくり出す技術について説明させていただきます。
<第一の技術:歌唱音声技術>
歌唱音声技術とは、初音ミクに歌ってもらう技術です。この段階では、初音ミクの独唱(ソロ)をつくることになります。初音ミクが踊っている姿も、楽曲の演奏も生成されません。
特許庁の検索エンジンで、「ヤマハ」「音声」で検索をかけたら、ボーカロイド技術に関する発明は5つありました。注目すべきは、「特許公開2002ー202790 歌唱合成装置」であり、これこそが、現在の初音ミクを成立させる技術と考えられます(2008年1月に日本国の特許権が成立済み)。
初音ミクの歌唱は、コンピュータがつくる声ではなく。現実の人間の声を使って生成されています。具体的には、生の人間の音声をバラバラにパーツ化して、データベース化してあらかじめ保存しておきます。そして、初音ミクに歌わせる時に、それらのパーツを素材として使って、再構成することで「歌」をつくり出すのです。この発明は、それらのパーツを連結する時に発生する「不自然さ」や「ノイズ」を除去するという技術に特徴があります。
この技術は、現実の人間の音声を「絵の具セット」のようなものとして保存しておき、歌唱をつくる時に、パレットの中でそれらの色を混ぜて、無数の色をつくり出せるようにして、カンバスの上に自由に絵を描けるようにしたもの、という理解でよいと思います。