UTAU音源制作wiki

収録の時に気をつける事

最終更新:

yutorichang

- view
だれでも歓迎! 編集
UTAU音源の録音は、録音・切り分け・録音リストに応じたファイル名を付けるなどの作業が必要になってきますが、
これらを自動で行ってくれる専用のソフトが配布されています。
専用のソフトを使うことで手軽にUTAU音源の録音ができます。
下記のソフトがおすすめですが各々の環境にあわせてソフトを選択してください。

UTAU音源のファイル形式は以下の形式が推奨されています。
wavファイルフォーマット



音量に気を付けよう!

音割れ

収録の音が大きすぎると音割れをします。
音の揺れの波(波形)の振れ幅が縦軸の限界を突っ切ってしまうと大きすぎた部分が平たくなってしまいます。

小さすぎるとノイズが多くなる

音割れを恐れすぎてもいけません。
小さすぎる音量で録音すると、ノイズと声が同じような大きさで録音されることになり、UTAUでの自動処理による声の音量の増幅と一緒にノイズも大きくなってしまいます。
ノイズ除去をかける場合にも小さすぎる音は向きません。ノイズ除去で完全にノイズを取り切ることができませんし、原音の劣化も避けられませんがその場合収録音量が小さすぎると情報が多く取り去られてしまい不利に働きます。

音量を調節しよう

録音するときは中くらいに納まっている状態がベストというわけですね。
オーディオインターフェイス+マイク,USBマイク,スマホこの3つのパターンに応じて調節方法を解説します。

オーディオインターフェイス+マイク

オーディオインターフェイスにあるIN(INPUT)のつまみを回します。製品によって付いている場所が異なりますので、それぞれのIFの取扱説明書やweb情報を参考にしてください。

USBマイク

PCのサウンド設定で変更します。
画像はWindows11です。
(macの人macのこと書いて~!)

スマートフォン

特にスマートフォン側で設定する項目はありません。スマートフォンと顔との距離で調節しましょう。

ノイズに気を付けよう!

ノイズにはたくさんの種類があります。後からノイズ除去という手もありますが、音が劣化してしまうのでなるべくやらないに越したことはありません。はじめから入らないようにするのがベストです。

リップノイズ

口を開け閉めするときに出る「ニチャア…」という音のことです。
口の中が乾燥している時に起こりやすいノイズです。収録中にこまめに水分補給をするのが大事です。
また、収録に臨む前に歯磨きをしておくとより効果的です。

ポップノイズ

「h」「f」「p」といった息を吹きかける音で発生する風の音です。
マイクに息が直接吹きかかるとこのノイズが録音されてしまいます。
対策として、ポップガードをセットする方法が一般的です。選ばなければ1000円くらいから売っていますし、アクとりや針金ハンガー、タイツなどを使って自作することもできます。収録するにあたり必須アイテムと言って過言ではありません。手作りでもいいので用意するのが無難でしょう。

スマートフォンでの録音の場合は端末のマイクの位置を確認して、なるべくマイクに息がかからないようにして録音します。
マイクが下側についているスマホだったとしたら、スマホの上側に息がかかるようにするなど、口元を調整して録音しましょう。

マイクを握ったりぶつけたりする音

マイクは繊細なので、扱いには注意が必要です。
マイクスタンドを使わずに握りしめて収録することはかなりのリスクを伴います。
マイク本体をぶつける可能性が出るだけでなく、握る音がノイズになったりコードが何かに触れたり接触が悪くなったりしても収録には悪影響を与えます。
気づかずに手が動いて…ということもあります。マイクは手以外のものでしっかり固定し、マイクから適切な距離をとって録音するようにしましょう。
マイクスタンドは選ばなければ1500円くらいから販売されています。

反響音

部屋に物が少ない場合に鳴ってしまうノイズです。
声は波なので壁から壁へ反射して響き合い反響音となってマイクに乗ります。
対策としては、吸音材を用意したり、物がたくさんある場所で録ることです。
吸音材はAmazonなどで売られています。段ボールをたくさん切ってなみなみの面が表に出るように重ねてブロック状にして、周りを取り囲むようにするなど、自作することもできます。
また、ぬいぐるみや布団・洗濯物をまわりに置くことでも反響音を軽減することができます。スマホ録音の場合は布団や押し入れ・クローゼットに潜って録音する方法もありです。

機械由来のノイズ

大前提として、マイク端子にマイクを直接挿してはいけません。
これぞノイズ!というノイズが乗ってしまいます。
せっかく買ったマイクを生かすためにオーディオインターフェイス(IF)を用意するのが無難です。
高くて手が出せないよ~~><という場合は、PCに直刺しするくらいならいっそスマホ録音の方がマシな音になったりします。
PC内蔵マイクorマイク直刺し < 安いイヤホンマイク < スマホの内蔵マイク < USBマイク < ちゃんとしたマイク+IF
の順で音質が良いです。
IFを使う場合も、マイクからPCに至るまでの間、コードを束ねるのは良くありません。
また、PCのファンの音、換気扇、扇風機、エアコン、セミや雨などあからさまなノイズ源からは離れるようにしましょう。

(せき・くしゃみなど)

これは、入っても特に問題ないといえば問題ありません。
しかし原音設定をする人は原音を聞きますし、UTAUではそのまま再生すれば聞けてしまうので、はずかしぃ~!という人は入らないようにする方がいいですね。

前後が切れないようにしよう

それ、ノイズじゃなくて子音かも?!

特に音の始まりの音で波形には小さくて映らなくても子音として必要な音の場合があります。
ガイドBGMを使わずに自分のタイミングで録音する場合、先頭の子音が録音されずに切れてしまうことがあります。手動録音モードを使う場合はある程度録音ボタンをおしてから声を出すまでに時間を置いた方がよいでしょう。
また、容量削減などを目的として録音した後前後を切り取る処理をする場合や、DAWを使って録音して後から切り出しをする場合に誤って切り落としてしまうことが多い場所です。余裕をもって目に見える波形より手前から切りだすようにしましょう。

語尾音

UTAUではフレーズの最後に語尾息や語尾音とよばれているノートを挿入することがあります。
息が抜けてフレーズを歌い切ったとという音があるだけで表情豊かに聞こえるからです。
専用に行を用意して録音することもありますが、もともと録音していた音の一番最後のところから切り出すこともあります。この場合、後ろが切れていると切り出すことができなくなってしまいます。
ガイドBGMを使った場合でも、一番最後の音を伸ばしてロングトーンにして収録してしまう人がいます。
こうすると折角のフレーズの最後の音が切り出せなくなってしまうので、息が抜ける音がしっかり録音されるようにしましょう。

PCの設定にかかわること

Windows11の場合、PC側で声が聞きやすいように加工を入れることがあります。原音が加工されると思った音質にならない可能性があるため、そのまま収録して、あとから専用のソフトでノイズ除去を掛けることが一般的です。
なのでこの部分の設定は普段はともかくUTAU音源収録時は切っておくのがよいでしょう。


発音にかかわること

発音にかかわることはキャラクター性にもかかわってくる部分のため、必ずしも意識する必要はありません。
変に意識すると妙に力んだ音源になってしまう可能性があります。
上記の音量・ノイズが最優先で、何も考えなくても意識できる・発音わけができる状態の場合のみ発音まで意識するようにしましょう。

発音は早いほうが使い勝手がいい

例えば「みゃ」なら同じ長さでも「みぃゃ~~」じゃなくて「ミャーーーッ!」のほうが後の調声・原音設定が楽になります。

みゃ1が「ミャーーッ!」でみゃ2が「みぃゃ~~」です
↑の画像では固定範囲(子/青)の線のみ変更してありますが、それ以外は共通の幅です。
よく見ると、1のほうではデフォルトの値のままでもちゃんと前の音と母音同士でクロスフェードできるような設定になっていますが、2ではクロスフェードする部分にまで[m]が入り込んでしまっているため、値を動かす必要が出てきます。

また、タイムストレッチをして引き伸ばされる部分(青~白)が1より2のほうが短くなっているため、ロングトーンの音符が出てきたときに、短い音が長く引き伸ばされてしまうことになり音質がわるくなってしまうことがあります。


連続音CVVCであればこの音より後にさらに音が来る場合、VCの部分に(オレンジ~赤)みゃの[y]が食い込んでしまって、前の音と重なる部分が短くなってしまい接続に難が出てくる可能性があります。

収録テンポより速いBPMや短い音符の場合子音速度(velocity)を調節する必要も出てくるでしょう。
収録時に多く使われるBPM120よりたいていのボカロ曲はBPMが速いことが多いので思ったような音源にならなかったりする原因になるかもしれません。
細かいことなので意識するのは大変です。慣れてきてからでいいのでのちの作業のことを考えられる録音ができるとかっこいいですね。

子音をはっきり発音する

とくに「さ行」「しゃ行」の話ですが、[s][sh]が少ないと活舌が悪くきこえてしまいます。
昔は鏡音リンが「とかちってる」とよく言われていましたね
https://www.nicovideo.jp/watch/sm84085
(ボーカルだけで聞くとちゃんと「とかしつくして」って言ってるんですけどね。)


原音設定的な観点からいくと「は行」もなるべく子音をしっかり言ったほうが良い行です。
特に単独音とCVVC。「は行」がしっかりしていたほうが接続がきれいになりやすいです。
連続音でも「は行」の[h]が少ないとスペクトラムが見づらく原音設定がしづらいです。

母音の連続音は切らない

母音の連続音(例:あんああいあうあ)では音と音を区切って発音するのではなく、つなげて発音するようにしましょう。
画像上:つながっている〇 画像下:切れている△

日本語の歌詞ではとにかく「あい」がたくさん出てくるのですが、「会いたい」という歌詞があった場合、「あ・い・た[a]・い」と切って発音するでしょうか?(メロディによってはあるかもしれませんが)おそらく「あーぃたーぃ」という風になることがほとんどではないでしょうか。
切れている音しか存在しない場合、どうなるか想像してみましょう。多分不都合が出るでしょうね。

「あたしが愛を語るのなら」(アンノウン・マザーグース)
これを歌わせようとしたとき、「愛」はつながってる方がよいですが、「が・愛」は切れていたほうが良いですよね。
切れて発音する音はそれはそれとして需要があるので、もし収録するのであれば最優先がくっついているほう、切れている方はおまけや特殊音素という扱いになります。
切る場合は切らない場合も併せて用意しましょう。

切れている音しかなく、再録もできない場合は、母音結合という単独音の方法でくっつけるやり方がありますのでなんとかなるといえばちゃんとなんとかなります。
逆に切れていない音がない場合もノートをつなげず休符を挟むことでなんとかなります。

「ガギグゲゴ」は鼻濁音

録音リストによってはカタカナの「ガギグゲゴ」の行があるリストがあります。
これは通常の「がぎぐげご」ではなく鼻濁音を録音するための行です。慣習的にカタカナで表現されています。
Youtubeなどで「鼻濁音」と検索してどんな音なのか確認してから録音しましょう!
普段発音する習慣がない人やうまく発音できない人は「ガギグゲゴ」が含まれる行を録音リストから削除して、録音しないというのも一つの手です。

ボーカフルライ・エッジボイス/がなり・グロウルに関して

搭載している音源もたくさんありますね。
ただし、これらは「周波数表」というデータがうまくつくられづらいです。
周波数表というのは原音の音程を解析して音の生成に使うデータなのですが、これが破綻してしまうとうまく音程が生成できずにゴボッというノイズが載った状態でUTAUから吐き出されます。
録音してももちろん問題ありませんが、あとで周波数表の生成でひと手間必要だと覚悟しておきましょう。

発音をそろえる

これを意識できるのはかなりの上級者、もしくは神経質な人でしょう。
普通に聞いても何が違うのかわかりません。
相当こだわりがある方はどれかに統一すると統一感が出ます。
またそれぞれを分けたうえで全部用意するとか。
違っていても原音設定や調声でなんとかなるので気になる人だけ気にしましょう

タグ:

+ タグ編集
  • タグ:
ウィキ募集バナー