UTAU調声メモ書き(仮)

自分が制作するためのメモ/覚え書き。

「嘘じゃないよ 付録 調声 仮メモ」の続きです。

現在の主な使用音源は重音テト単独音。

先人のサイト様より当方にとって新知識な点を、引用&リンクさせていただいてます。
思うところを随時書き足したい予定。



■まず記事の紹介。UTAUを作られた飴屋さんと、アクエスト社の社長さんが、UTAU周辺の音声合成技術の特性を語っておられます。個人的に「そうだったんだ!」と驚いた箇所を一部引用。

あなたの声で歌うソフト「UTAU」の奇妙な世界
2010年08月14日 ● 四本淑三
http://ascii.jp/elem/000/000/546/546155/

飴屋 音声合成の面白さは、一つの答えがないことなんですね。人間の声は多様だし、今のアプローチが唯一の答えかどうかは分からない。だからのめり込むと面白いんです、この分野は。

>―― 音関係は出音さえ良ければそれが正解ですからね。

飴屋 そうそう。変なところで工夫が必要なんですよ。理論ではこれが正しい、すごいでしょってやるんだけど、理論で作ってみてもいい音にはならない。理論と全然関係ないことが必要だったりするんです。

>―― シンセを設計している人達も同じことを言いますね。理論的に正しいことと音は別だって。

■調声やミックスにはセオリーはあると思うけど、「絶対」じゃない。音楽およびシンセサイザー/楽器の最大の特長と面白さだと思います。もっと大きく言いますと、芸術/表現全般が奥が深いのです。

初音ミクと「ゆっくり」の声、何が違う? アクエスト社に聞く
2010年08月29日 ● 四本淑三
http://ascii.jp/elem/000/000/550/550525/

>―― 僕も大学の授業で学生全員のフォルマント分布を調べたことはあるんですけど、同じ発音でも全員、まったくパターンが違うんですね。

山崎 違いますね。同じ人でも毎回違うんですよ。普通に話をしていても、前後の関係で全然違っちゃう。何が正解なんてないんですよね。そこが一番難しいところですね。




山崎 昔から音声合成をやっていて、非常に思うところがあって。究極のテーマというのが「自然じゃない合成音」を作りたいんです。世の中の合成音声関係者は「より自然になりました」って言ってしまうんだけど、じゃあ自然って何? 自然な合成音って何のこと? そう考えたときに、いかに人間に近づけるかということを目標にしている。

>―― 今の合成音声はそっちの方向を向いていますよね。

山崎 そこから少し下がって、私個人としては、人間の真似をすることは止めにしましょうと。聞きやすかったり、綺麗だったりすれば、人間に似てなくたって全然いいじゃん、というのが根本的な発想なんですよ。

音声合成技術の真髄だと思う。狙いどころは生ボイスとロボットボイスのあいだでしょうか。人間と機械の歌唱のあいだに何か未知の新しいエロスがあるのかもしれない。




■UTAU調声 もうすこし具体的な話。UTAUボーカルの処理には三つの段階。

村田PによるMIX比較
http://togetter.com/li/50747
>「伝説のテトマスター」「テトの本気」でお馴染みの村田PによるMIX比較。同じ調声でもMIXでかなり違います。

制作途中の段階のmp3が聴けます。完成前のテトボーカルはたしかに驚くほど地味。意外です。ミックス&エフェクターの要素が大きいんですね。キラキラ輝くようなパワーボイスに演出する技量と腕前のセミプロな方です。


私見ですけど、調声は「料理」に似ていると思う。

音源(素材) → UTAUエディタ(調理) → MIX・エフェクター+マスタリング(盛り付け)


みたいなかんじです。アナログの料理と違ってデジタルは何度でもやり直せるので気が楽です。生の食材のように痛まないし腐らないし。

(余談ですが、高級食材を扱うシェフ/板さんはほんとに度胸あると思う。超高額木材を一発勝負で切り出す宮大工もすごい。場数を踏み、痛い失敗もして技能を修得するのでしょう。ちなみに当方は料理は下手です。。。)


UTAUボーカルのクオリティUPには、この三つの段階全部でレベルを上げる必要があります。まー、べつに音のクオリティがすべてではないですけど、音がでかくて滑舌が良い方が好評な場合が多いんじゃないかと。(ポップスはボーカルが主役でオケは従。ボーカルを主に聴くものだから) あと、音源(素材)のクオリティUPは中の人の意志とプライドと技量と運次第だと思います。


以下、雑談と感想。。。
村田テト『えれくとりっく・えんじぇぅ』は、UTAUの代表曲のひとつ。UTAU調声の「自然な合成音」路線の頂点。「人間が歌っているとしか思えない」大変なクオリティで、最初に聴いたときには本当に心底驚きと衝撃を受けました。

「魂入ってる!!」 「こんなことが出来てしまうんだ!」 という驚き。知らされずに聴いたら、生身の意志を持った人間が歌っていると勘違いする人もいるんじゃないかな? 実在感のある表現が好き。(キャラはアバターで演じさせているんですけどね。) いえ、訂正。テトさんは実存するんです。古今東西の神サマと同じで、脳科学的に在ると感じるものは在るんです(キリッ

ミクオリジナル曲の歌詞がまた完全に嵌る。ロックテイスト。パワーボイス。ミクは「かわいい」 テトは「かっこいい」 と評されてますね。

ああ、でも、何度も聴いているうちに慣れてきた…… 人間はどんな驚きと刺激にも慣れてしまうよ。。。

音声合成技術的には「限界を突破」して到達してしまったのでは? あとは横に広がるだけで。音源の追加やバージョンアップ、新しいツールの開発、技法の発案で、繊細な表現や微細な差異が可能になってゆくのだろうか?

村田Pさんは、曲調とテトの声質が恐ろしいほどマッチするので誰がやっても歌ってくれますよと、後日のツイートで謙遜されてましたが、やはり最初に具現化するパイオニアは尊敬です。





■UTAU調声セオリーは『滑舌対策』に集中している印象。

2009年05月03日 02:48 投稿
【UTAU講座出張編その0】夕日坂で調声公開【穂歌ソラ】
http://www.nicovideo.jp/watch/sm6927754

二年前の動画で、男性音源(単独音)の場合「か」はこうして(「か」のアタックをMAXに強調)処理するんだと驚く。感心。
(テト単独音はハッキリ子音なのでこの処理をしなくても聴き取れます)

「さ行」は子音が伸ばせる特長があるのか。へぇー、知らなかった。
「し〜〜〜〜〜〜〜〜っ」ってヤツですな。「しいいいいいいいいっ」とは確かに言わないか。

『ん』を挿れる手法とか独特。

hとかsとかshとか、原音設定で自分で子音素を作る手法。
回避方法が裏技みたいだなぁ。この時点でこれだけのセオリーが発案されていたんですね。



この調声公開動画は、うたらんまとめブログ様で知りました。あと二編を紹介されてます。


■うたらんまとめ UTAU講座 | Wed 05.2009
http://utauhirohiro.blog56.fc2.com/blog-entry-72.html
>最近、UTAU画面を表示させながら楽曲をながし、調整方法を見せている動画が増えています。

■余談
当方はポルタメントで「音をつなげる」のが個人的に好きじゃないんですよ。あんまりにも機械的な人工的なピッチ曲線の変化は、ウタウでもボーカロイドでも「不自然さ」の要因になっていると思うのです。現時点での個人的嗜好ですけどね。何も生身のマネをせんでも。。。生ボーカルでは逆に難しい完璧なピッチのフラットで平板な歌い方が好み。




「かきくけこ」「か行」の発音の前には空白が必須。全ての音源で。人間の口の構造上。というのは、、、、後日書き足します。
あと、すごい便利ツールが二つあるじゃん! というのも。。。

とりあえず、ここまででアップ。


2011.1.19アップ 2011.1.30最終更新



続き

■具体的なUTAU調声 滑舌セオリー(主に単独音)


「か行」「た行」の前に空白を入れる。前の音のエンベロープ終端に隙間を作るか、休符を入れるか、どちらかで。
理由。人間の発声上そうだから。音が途切れるとのこと。

知らなかったけどこれは自曲でも所々ではやっていた。試しに拙曲『嘘じゃないよ』で全部にやってみると……いやあ、滑舌良くなるね。やっぱ理論理屈もたいせつだぁねえ。

「連続音」だと自然に空白が入っている。慣れれば「連続音」の方が調声の作業量が少ない様子。波音リツ連続音が優秀らしい。


「ま行」の前に小さく『ん』を入れる。この手法の理由。口を閉じる発音で、鼻から抜ける音を表しているそーです。へぇー、人の発声の理に適っている。よく発見発案されるもんだねぇ。自然には思いつかない。
単独音テトは滑舌が優秀なので、『ん』を入れなくても聞けると思う。隙間or休符でもよいのではなかろうか?


ももももP様のブログ もももももももも!
http://mox8.blog47.fc2.com/
から、カテゴリー 調声に役立つかもしれない話 ほかより内容を一部引用しました。

連続音を参考にしてみる
http://mox8.blog47.fc2.com/blog-entry-74.html
「か行」の調声の話。

単独音で頑張ってみる
http://mox8.blog47.fc2.com/blog-entry-92.html
「ま行」の調声の話。


歌い出しには休符を入れる。(DAWでのミックスの場合)

ももももP様のブログ もももももももも!
テンポの話
http://mox8.blog47.fc2.com/blog-entry-179.html
>歌い出しに休符を入れておくのが良いです。 休符を入れないと基本的に先行発声で音がズレるので

知らなかった。半年以上使っていて気づかなかった。人間はジャストのタイミングより先に発声するんですね。そちらに感心も。。。
拙曲『嘘じゃないよ』では歌い出しでいきなりズレていた!! やっとテンポがキッチリ一致。ごめんよマイPCの中のテトさん。


「い」「う」の音量は他の音に較べて小さくなるかもしれない。傾向として。




ここまで。また書き直し、追記すると思います。調声とミックスを作成し直した自曲『嘘じゃないよ』を近日中に揚げたい予定です。

2011.1.24アップ 2011.1.27最終更新



続き。

HANASUと連続音での便利ツール二つのご紹介


長尺のHANASU動画がふしぎだったのですが、この便利ツールを活用していたのか!

ももももP様のブログ もももももももも!
HANASUで重宝しそうです
http://mox8.blog47.fc2.com/blog-entry-111.html
>【UTAU】Mode1用ピッチエディタプラグイン紹介

ピッチがペンで自在に書ける。ペンタブでの作例がより自由で素晴らしい。

チマチマした手作業から「産業革命」的進歩だ。
プログラム/ソフト/ツールを作れる人はほんとに尊敬。当方まったく作れないので。作業の自動化、ツール化はデジタル時代ならでは。2009年の時点で在ったんですね。ぜんぜん知らなかった。


連続音で必須の便利ツール 音量の調整がカンタンに

2009年10月14日 01:02
【UTAU】拡張エンベロープエディタ【プラグイン】
http://www.nicovideo.jp/watch/sm8507815
>■これは、クロスフェード部分を保護しつつ、複数の音符のエンベロープを一括して編集することができるエンベロープエディタです。
>■連続音音源のエンベロープ設定のお役に立てるのではないかと思います。

>■最新版ダウンロード先
(UTAU互助会ウィキ)http://www20.atwiki.jp/utaou/pages/36.html


上記ツールと同じ作者様が作られたツール。
UTAUマニュアル様の説明指示に従って、重音テト連続音を一度テストした時にセットをしてました。こういう風に使うのか。

この動画の再生数がそんなに多くない。UTAUで連続音音源まで使ってみようという人の総数が少ないのか? この便利ツールの存在が知られていないのか? どちらでしょうか?


連続音について 接続方法を絵で判りやすく説明

ももももP様のブログ もももももももも!
連続音の話
http://mox8.blog47.fc2.com/blog-entry-77.html
連続音の接続方法を絵で一目で解りやすく。

説明上手です。連続音の接続方法と処理・設定の理由がいまいちピンと来なかったのですが、おおよその感じは理解したような。


↓連続音でのUTAU設定の理由メモ

・モジュレーションはゼロに。ゼロにする理由は、母音発声中のところでクロスフェードで繋げるから。モジュレーションをかけると不都合が発生するそうです。
・クロスフェードで常に繋ぐ。連続音として使う分には、基本的にはそれ以外で繋げようがない。
・ポルタメントが常にオン。滑らかに変遷するのが特長だから、音高が変われば必ずポルタメントになると。


この時のももももPさんが念押しされてますが、連続音音源には一長一短がありますね。ハキハキ歌うのは苦手でしょうね。バラードっぽい歌に向いているのかな?

連続音は触っていないのですが、上記の便利ツール等を活用すれば、慣れれば高速で歌唱が作成できるのかなと。


あと、テト単独音と混ぜて、連続音を単独音として一部に使ったりしました。べつに構わないでしょう。




ももももP様のブログから主に引用とリンクを貼らせていただきました。
情報と知識を広めて、UTAUシーンが盛り上がるとよいですよね。というか盛り上がってほしい。
このページも超々小さい一助になれば……


2011.1.27アップ 2011.2.2最終更新



付録。

単独音セオリーの基本動画

2009年01月13日 16:19 投稿
【UTAU】炉心融解で調声講座【重音テト】
http://www.nicovideo.jp/watch/nm5833067

「UTAU単独音」調声講座動画の基本。当方が紹介しなくてもUTAUユーザーになった人は御覧になると思います。「か行」「た行」の前に空白の説明も出てきます。2009年1月の時点でこれだけのセオリーを開発されていたと。
この後、新ツールや連続音が登場しているので、現在はこのやり方がすべてではないです。




村田Pと飴屋Pのツイートから UTAUの話
以前にザーッと見て慧眼だなぁと思ったポイントを引用します。

■村田Pさんのツイートから

>ヽ( ´¬`)ノ個人的にはUTAUの調声って、UTAUエディタ3、MIX・マスタリング7ぐらいの割合で出来が決まると思います。 2:04 AM Jan 2nd webから
http://twitter.com/murata_P00/status/21507025309540354

>ヽ( ´¬`)ノボカロだと4、6なイメージ 2:07 AM Jan 2nd webから
http://twitter.com/murata_P00/status/21507904720867328

「MIX・マスタリング7」というのは思ったより比率が高い。

MIX・マスタリング重視派という流派があるのかな? UTAUエディタでの調声自体はアッサリされていそうなPさんと想像。。。

ミックスダウンとマスタリングについては検索して調べてください。生ボーカルと同じ扱いです。ネットで多くの情報が公開されてます。それ専門でメシを食うプロがいるくらい専門的領域で超奥が深いです。



■飴屋Pさんのツイートから

飴屋P

> UTAUが色々な音源で破綻しないのが凄いんじゃなくて、音源提供側の試行錯誤や自然淘汰のおかげで「UTAUで破綻しない音源」しか残ってないんだと思います。
10:41 PM Oct 2nd, 2010 Tweenから 9人がリツイート
http://twitter.com/ameyaP_/status/26241750116

以下余談・脱線話……
ボーカロイド〜UTAUのネットのシーンは、ものすごく自由資本主義的現象。
自由競争 規制なし 出入り自由 参加自由 自主的分業 自由意志尊重 自由市場(自由投票)…… 

アダム・スミス、リカードあたりの英米系古典経済学者が泣いて喜びそうな?猛速度の進化。趣味文化の領域では爆発的に出来るのに、なんで日本経済は規制だらけでガチガチで自由が無いのだろうか? 社会が安全にはなり、物理的環境が良くなり、目に見えるような公害は無くなったプラスの面も有るが、デメリット・マイナス面がひどすぎる。

話が大きくなりますが、さらに以下、超余談。


「自由」はべつに最高のものでもない。
「自由市場」と「リスク」はバーターだろうし、規制という名のルール設計でなんとでも変わる。

「自由」と「結果の平等」はバーター

自由競争 = 機会の平等 & 結果の不平等

「結果の平等」なんて自然の世界にあるわけないじゃないか。人治の世界にタテマエ的にあるだけで。「機会の平等」が確保されているだけでもすごいことなんですが。。。日本人の大多数派はこのスカスカの「結果の平等」が大好きなんでしょうね。。。国力衰退の主因じゃ? 「自由競争」を否定する国が発展するわけないだろう。


脱線つづきで社会派なメモ

日本型統治権力が腐っていたこと。集団社会のボスらが差配するタテマエ平等の欺瞞。そのウソがバレた。老人権力がトップを占める巨大ネズミ講。日本は企業制社会主義and官報複合体による人治主義型封権体制and日本型集団主義ムラ社会。こんなことは20〜30年くらい前から識者が指摘していますが。これを往時は「管理社会」とか言ってましたが、「消えた年金」騒ぎ「汚染米」騒動が典型例のように、普通の管理も出来ていない、いい加減な統治権力でした。威圧的で建前的で教条的で形式的で、70、80の権力ジジイが利権を振り回す、頭から老化した老人権力国家、経済老大国…… (とはいえ、既得権益側に回れば規制維持をしたがるでしょう。それも自然な人心。また国民多数がそういういい加減な統治権力を望んだとも。『所得の捕捉がいい加減。土地台帳が超いい加減。』 これは東浩紀氏の指摘。白田秀彰氏との対談での発言。あ、ニコ動のロージナ茶会チャンネルで視聴できます。対談29分付近から。明るく深い話をされてますよ。山梨県の土着選挙の話とか面白い。) (以上ロシア文学的ドストエフスキー的長文、飛躍して結論→) だから、自由はネットにしかない。




2011.4.29追記 自由主義への憧れを上記に書きましたが、じつは日本では人気のない思想であり好悪だと思う。

サンデル教授 内田樹先生 宮台真司 このあたりの人たちが説く「共同体主義」も説得力がある。去年初めて知る。これができたら美しいでしょう。。。個人が共同体の中で成長する過程で期待される役割をこなしてゆく。一歩間違えるとウヨク。というか、一周回った右翼思想。
何が美しいかが自明じゃない。何が良い伝統保守思想かは共同体の先人・年寄り・有力者・権威・権力が決める。イスラムとキリストとでは違う。アフリカも中国も日本も全て違う。

自由主義経済の合理主義は超ドSで人気がない。もしも人が合理だけで動くなら冠婚葬祭はいっさい要らない。宗教も必要ない。死も悲しくない。が、そんなことはない。けっきょく情と理、不合理と合理のあいだで揺れ続けるのが生身の人間なのでしょう。。。

日本人は不合理? いえ、ショッピングモールという合理を選んでいる。自由主義経済はイヤだと言いながら消費行動で現代都市文明の便宜を選択。。。



…………。
調声方面の私見を、(脱線部分は余計でしたが) 書いてみました。新知識があれば随時追加します。



上記の調声セオリーを投入した最新作がこちらです。

先日、重音テト連続音を試してみて、濁った出音に、固まった。。。え、先行するPさんらはこれを使いこなしているの? すごいよ。オーバーラップ値を適切に設定するのが連続音の秘訣らしいんだけど、、、目下調査中。

2011.1.30アップ 2011.4.29更新 2012.1.24補記 強調箇所変更