【トーク】調声方法

タグ:トーク


ポーランド岡山さんからご寄稿をいただきました。ありがとうございます。以下では編集やバージョンアップに伴う追記・修正もかなり加わっていますので、編集前の原文はポーランド岡山さんのブログ(アーカイブ)をどうぞ。


<CeVIOのトーク調声講座の動画>

以下の解説のご寄稿をいただいたポーランド岡山さんによる、調声講座です。
以下の解説の主な内容が入っているほか、一歩進んだ説明も入っています。おすすめ。


ポコタンさんによる「CeVIOがよくわかるお話」シリーズのトーク編も参考になります。





<CeVIOのトーク機能の特徴>

ボイスロイドとCeVIOの違い

同じような機能をもつVOICEROID(ボイスロイド、ボイロ)と特徴を比べてみます。
ボイスロイド
  • 長所…アクセント句ごとに抑揚・高さ・速さの調節が可能で、全体的なイントネーション調声に強い。
  • 短所…アクセント句内の一音だけ音を上げるなどの細かい調声は出来ないため、感情表現が平坦になりやすく、工夫が必要。
CeVIO
  • 長所…全てのボイスが感情設定に対応している。感情設定や、一音ごとに細かく高さ・速さ(長さ)を調整する事によって、強調表現や音外しなど、より人間的な話し方が出来る。専用APIで外部ツールと連携しやすい。
  • 短所…音質が粗め。くだけた話し方の場合に、アクセントの調整が必要になりやすい。

※CeVIOのバージョン6以降は、アクセントの調整がボイスロイドと同様の方法になったため、話し方を自然にする作業がとても簡単になりました。


CeVIOのキャストごとの調声難易度


CeVIO CSの場合


 CeVIO CS  CeVIOの調声難易度はキャスト(キャラクター)ごとに違います。
  • いじれるパラメータの少ないすずきつづみちゃんが一番難しく、それより新しいONEちゃんが比較的自然かつ素直に喋ってくれるため調声が簡単です。(個人の感想です)
  • さとうささらさんは簡単とも難しいとも言えない主人公らしい性能をしていると思います。
  • タカハシくんに関してはあまり触っていないのでよく分かりませんが、ささらさんと同じくらいか、もしくはささらさんより簡単かもしれません。でも単純に私にこだわりが無いだけかもしれません。

CeVIO AIの場合


 CeVIO AI  調声難易度はキャスト(キャラクター)ごとに違います。

※以下は、追記者の個人的感想です。エンジンやボイスのアプデ等でも変わります。
  • 前提:Ver8.1の場合
キャラクター 備考
小春六花(1.0)
IA(1.0), ONE(1.0)
弦巻マキ(英)
ONE(1.1), IA(1.1), 弦巻マキ(日), フィーちゃん, ロサ(ROSA),小春六花(1.1)
夏色花梨,すずきつづみ,花隈千冬
さとうささら

  • 小春六花
    • (1.1.1)アップデートで初期のじゃじゃ馬な挙動はかなり解消しました
      • パラメータを大きくいじっても、震えやノイズが出にくくなりました
      • 話速や息の混じり方も少し変わっていますが、声や話し方の印象は1.0と大きくは変わりません
    • (1.0)初期音源ということもありじゃじゃ馬な印象です。震えやノイズが出やすい印象です。
    • (1.0)話し方が意外にゆっくりなのと、CeVIO初心者にありがちなパラメータ弄りすぎが原因で上記印象が良く言われることなっていると思われます
    • (1.0)なるべくプリセットに近くする、句読点をしっかり入れることで落ち着きます
      • (1.0)プリセットはかなり高性能です。
    • (1.0)ボイスのアプデで改善する可能性があります
  • IA
    • CSのボイスと比べると幼い印象になります
      • CSの印象に合わせるには少し調声が必要になります
      • AIソングボイスも同様に幼い印象になるようです
    • (1.0)ゆっくり目にしゃべりますのでパラメータを弄ると破綻が出たときに目立ちやすいです
    • (1.1)話すスピードとアクセントが改善され、破綻もしにくくなりました(弦巻マキ相当の印象です)
    • デフォルトで元音源から「声質」を弄った状態と思われます
  • OИE
    • CSのボイスと比べても声の変化が感じにくいです
    • 長文の読み上げは声優さんの読み上げではなく、若い女性アーティストさんの喋り方で読み上げるので、やや苦手かもしれません(よく言えば自然、悪く言えば素人っぽくなります)
    • (1.1)話すスピードとアクセントが改善され、破綻もしにくくなりました(弦巻マキ相当の印象です)
    • デフォルトで元音源から「声質」を弄った状態と思われます
  • 弦巻マキ(英)
    • 最新の音源ということもありかなり優秀です
    • 日本語訛りがあります(英語ネイティブ話者向けだと指摘される可能性があります)
    • 音源だけの問題ではないですが、単語の読み変更はかなり難しいです
      • 直接音素記入しかなく(ソングの音素パレット相当がない)、英語に少ない音素の組み合わせは推定に失敗しやすいです(特に長さ)
  • 弦巻マキ(日)
    • 最新の音源ということもありかなり優秀です
    • 「元気」が比較的元気じゃない:単体だと気が付きにくいですが、ほかのボイスに比べ、明るい感情がそれほど明るく感じられません。全般的に感情値が落ち着いた印象になります。
    • あえて欠点を上げるなら以下の点です
      • デフォルトだと小春六花に似た声に聞こえる
        • 元音源が同世代の女性声優さんという発声の類似性があるため、小春六花とデフォルトで並べると区別がつきにくいことがあります。
        • VOICEROID版がかなり声が低い音源であったことも一因かもしれません
        • 「高さ」を下げる、「声質」を上げることで差別化が必要かもしれません
      • やや感情に乏しい(六花やささらに比較して)
  • さとうささら
    • 優秀だった弦巻マキよりもさらに優秀です
    • ピーキーな調声をしない限りほとんど破綻しません
    • 感情表現が非常に優れています
      • 裏を返すと淡々とした読み上げなどには調声が必要になります
    • CSと比べると「哀しみ」が別人レベルで変わりました
      • CS版ささらから調声を引き継ぐ際などには注意が必要です
      • 中の人の某有名キャラに近くなりました
  • フィーちゃん
    • 調声難易度は弦巻マキ~ささらの間くらいの印象です
    • 「怒り」が語尾が少し強くなるだけですので怒り表現には使用しにくいです
      • 音の高さを下げ、話速を遅くするなど別のパラメータで怒りを調声する必要があります
      • 実質的には4感情くらいに捉えていたほうが良いかもしれません
    • ふわふわした可愛らしい声の印象とは異なり、「普通」の話速は比較的早めです
      • 近い印象のIAとの会話する際は話速の差に注意が必要です
  • ロサ(ROSA)
    • 調整難易度はフィーちゃんと同様くらいの印象です
      • 感情パラメータ数が4つで迷わない分、フィーちゃんよりラクかもしれません
    • 元気だが萌え声系ではない若干低めでリアルな声、という意味で希少な声です
    • デフォルトそのままでは若干棒読みっぽくなる(特に「普通」)ので「抑揚」を少しつけるとより感情豊かになります
      • 語尾に「!」をつけるのも効果があります
  • 夏色花梨
    • 調整難易度はさとうささらと同程度かやや劣るくらいの印象です
      • 感情パラメータが5つあるため初心者はやや戸惑うかも、ということでやや難しいです
      • 逆に「落ち着き」があるため、ナレーションはささらよりも得意です
    • 「怒り」のニュアンスが小春六花とは異なるため、一緒に組ませて怒らせる場合は注意です
  • すずきつづみ
    • 調整難易度はさとうささらと同程度かやや劣るくらいの印象です
      • 感情パラメータが5つあるため初心者はやや戸惑うかも、ということでやや難しいです
    • 元のキャラ設定もあり、感情値をMAXにしても控えめです
    • 雰囲気はCSと近いですが、同じパラメータ設定でも全く同印象にはなりません
      • 以前(CS版)と同じ印象にするのはやや工夫がいります
    • 「ひそひそ」は2022年時点でCeVIO唯一のささやき声です
      • 単体で使用しても良いですが、他の感情と組み合わせることで真価を発揮します
  • 花隈千冬
    • 調整難易度は夏色花梨と同程度です
    • 言葉を走りがちに発音するため、早口でしゃべる印象です
    • 息成分はやや多めですが、AIすずきつづみとはニュアンスが異なる雰囲気です
    • キャラクターの見た目のように地味めの印象ですが、感情パラメータによる差異は結構出せます
      • 似た印象のすずきつづみとはこのあたりが異なります
    • 「怒り」のニュアンスは小春六花・夏色花梨とも微妙に異なるため、一緒に組ませて怒らせる場合は注意です



<調声方法>

1. まず初めに(注意書き)

この解説は(多分)基本的な日本語表現に基づく調声の行い方の解説です。スラングや略語など崩した言葉遣いや方言などの訛りまでは検証していません。
更に言うと日本語表現の解説の様な事もしていますが、専門家でも何でもないので間違った知識の可能性も多分に含んでいます。
そもそも効率的なやり方かどうかも分かりません。
「こうすればいいと思うよ!」「ふーんそっかー」程度に読んで下さい。
また、基本的に確認はささらさんで行っています。基本的には全てのキャストで通じると思いますが、それぞれ修正は必要になると思います。

操作方法に関しては、CeVIO公式サイトのユーザーズガイドを参照してください。
 CeVIO CS  CeVIO CS製品版の全機能が一カ月無料で使用できる体験版が公式サイトからダウンロードできますので、気になる方はそちらでお試しできます。ONEちゃん・IAちゃん以外のCSトークキャスト全員が使えます。


2. 調声に入る前に(デフォルトの表情設定)

喋らせるキャラクターのイメージを頭の中で固めましょう。キャラとして(CeVIO、もしくはCeVIOが声を当てる対象)として喋らせる場合には、まずどんな声でどんな風に喋らせるか?というイメージが大事です。
イメージが出来たら、それに合わせてセリフ全体のデフォルトの表情を設定していきましょう(これはボイスロイドでいうところの音声効果の設定にあたります)。

 CeVIO CS  参考までに、私はデフォルトの表情設定を以下のとおりにしています。(大きさは全員Maxの100にしているので割愛)
さとうささら 速さ55 高さ60 声質45 抑揚50 元気100、普通0、怒り15、哀しみ15
すずきつづみ 速さ55 高さ35 声質50 抑揚75 クール100、照れ25
タカハシ 速さ50 高さ25 声質80 抑揚100 元気0、普通100、へこみ100
ONE 速さ50 高さ60 声質45 抑揚55 感情ゲージはAllMax
ささらさんとつづみちゃんは公式のキャラクターっぽさが出るように、
タカハシくんは唯一の男性トークボイスなので低さを生かした設定に、
ONEちゃんは公式キャラクター設定はほぼないので幼く、純朴で天然っぽく…などをイメージしています。

デフォルトの表情設定を作ったら、適当な名前をつけてプリセットに追加しておきましょう。


3. 違和感を無くそう

単語内の読み方やアクセントの間違いを直そう

まず、単語の読み方やアクセントの間違いなどを修正してあげましょう。
  • 漢字の読み間違いの修正は、単語登録で漢字自体の読みを修正したり、漢字を平仮名や片仮名に入力し直して修正したり、別のセリフに言い換えるなどの方法があります。自分がやりやすいと感じた方法で修正しましょう。
  • ルビ機能を使って青空文庫方式で読みを指定する事もできます(CS6以降)。
《》内にひらがな/カタカナを書いて、読みを指定することができます。
(例) 今朝|四月一日《わたぬき》さんに会った。 ※「|」でルビ対象を明示。
(例) こんにちは、四月一日《わたぬき》さん。  ※「|」を省略したときは始まりを推定。
《》内は単語登録と同様に「’」で母音の無声化も指定できます。

  • 単語内の音の高低(アクセント)は、単語登録で修正するか、「ACC」のグラフで調整できます。
    音の高低を自分の耳で調声出来ない場合は、アクセント辞書で調べたりしましょう。ボイスロイドを持っている場合は、そのイントネーションタブのアクセント句の高低を参考にするといいです。
  • なお、文章に「てにをは」をきちんとつけたほうが、アクセントが正確になりやすいです。
    「てにをはを省きたいけれど、アクセントがおかしくなって困る…」というときは、てにをはの代わりにスペース(全角でも半角でもOKです)を入れると、うまく行くことがあります(スペース部分の長さはLENで詰められます)。
例:「タカハシ君はジャッジお願いね?」
→「タカハシ君はジャッジお願いね?」または「タカハシ君はジャッジ お願いね?」

文章全体の高低の表現をつけよう

次は、文章全体の高低(イントネーション)を調整しましょう。
イントネーションとは、「文全体の意図する雰囲気や空気」のようなものです。同じ文章を話すときでも、話し手の意図や強調したい点が異なれば、文章内で高くなる場所が変わります。これがイントネーションです。

日本語は基本的に、文章の頭では声が高く、文章の終わりでは声が低く、音が上から下に落ちていきます。そして、文中のある単語を他よりも高く発音する事によって、強調表現を行います。強調表現という言葉にピンと来ない場合は「その文中で大事なポイント」と考えると良いでしょう。
CeVIOでは、強調したい語句で、高いアクセントになっている母音をさらに高くすることで、強調表現が出来ます。

例文:「私はあなたが好きだ。」

この場合、アクセント句は [私は][あなたが][好きだ]の三つに分かれます。
どのアクセント句を強調する(大事にする)かによって、文章の意図が変わってきます。
  • [私は]を強調したい場合
    • [ワタシハ]のアクセントは[ア]が低く、[タシハ]が高くなる「平板型」なので、[タシハ]の母音、[a i a]のPITを高くする事で強調されます。
  • [あなたが]を強調したい場合
    • [アナタガ]のアクセントは[ア]が低く、[ナ]で上がり、[タガ]で再び下がる「中高型」なので、[ナ]の母音、[a]のPITを高くする事で強調されます。
  • [好きだ]を強調したい場合
    • [好きだ]も同じ「中高型」なので、[キ]の母音、[i]を上げる事で強調する事が出来ます。
考えるのが面倒だったら、とりあえず音素グラフを見て一番高い音を片っ端から更に高くすれば強調できると思います。多分。


4. 感情表現をつけよう

セリフごとに感情設定(図②)を変えると、会話の全体的なメリハリを簡単につけることができます。


特にささらさんやONEちゃんのように感情バーが豊富な場合は、喜怒哀楽の表現を細かく行えます。
(たとえば、ささらちゃんの場合、「元気」「普通」「怒り」「哀しみ」を好きな割合で混ぜることができます。)

また、セリフごとに コンディション(図①、速さ・高さ・抑揚の大きさなど)をいじるだけでも感情表現は可能です。

例えば…
  • 緊張など、速いテンポを表現したいとき →「速さ」を上げる
  • 非常にびっくりしたりテンションが上がっているとき →「高さ」をMaxに
  • 上の空やロボっぽくしたいとき →「抑揚」を下げる
  • 「声質」は高くすると声が大人び、下げると声が子供っぽくなります。
    • ※(0にするとプライバシー保護音声みたいになります)

コンディションや感情設定をいじる際は、既存のプリセット設定が変わってしまわないように、調声用に新しくプリセットを追加したり、メモ帳などに設定を残しておくと良いでしょう。

TIPS
 CeVIO AI  ver.8.1.38~
CeVIO AI ver.8.1.38 から、調声済みパラメータをセリフ行単位でコピー&貼り付けできるようになりました。
セリフ行を選んでコピー→別のセリフ行を選んで右クリック→「パラメータのみ貼り付け」で反映できます。

TIPS
※なお、あるトラック内のあるキャストのセリフ全てについて、パラメータを一定の値に変更することもできます。全体的なテンションなどを変えたいときに便利です。

方法としては、[Alt]キーを押しながら(押してから)パラメータの値を変えると、そのトラック内のそのキャストのセリフが全て、変えた後の値になります(他のトラックや、同じトラック内でも別のキャスト(キャラクター)のセリフには影響ありません)。

さらに、パラメータだけでなく、プリセットを一気に変更することもできます。[Alt]キーを押しながら(押してから)プリセット枠をクリックして選択すると、そのトラック内のそのキャストのセリフ全てに、そのプリセットが反映されます。



5. さらに工夫してみよう

微調整を簡単に

パラメーターや音素グラフは、その上でマウスホイールを回すことで少しずつ動かすことができます。
最後の微調整に便利!


文節全体を速くしたり遅くしたりする

CS6から採用された音素グラフの新バージョンでは、「PIT」の画面で、上部の文字エリアのところで、文節ごとの縦線をドラッグすると、その文節全体を均等に速くしたり遅くしたりすることができます。1音1音の音の長さを調節するより便利かも。
具体例:https://twitter.com/suidasisan/status/976389871907495938

単語単位で音量やピッチを調整する


 CeVIO AI  CeVIO AI Ver.8.1.21で、単語単位でVOLやPITを上げ下げできるようになりました。PIT/VOLの画面の上部の文字エリアで、カーソルが十字になったあとにマウスドラックで上下に動かすことで単語単位で変更できます。
同時にピッチスムージングも改良されています。
https://twitter.com/CeVIO_st/status/1451047903124856832

子音の調整

日本語の発音では母音の影響が大きいので、基本的には母音を中心に調整しますが、子音を調整するとさらに多彩な表現がつけられます。
  • PIT…母音と子音であえて高低差をつけることで自然になることがあります。また、子音を高くすることによって声をひっくり返したり、低くすることによって潜らせたりなどが出来ます。
  • LEN…子音を伸ばすことによってセリフに溜めを作ったりなども出来ます。


 CeVIO AI  CeVIO AIでは0.5sec.程度以上の長さに音素を伸ばすと合成に失敗して音が破綻したり、ノイズが乗ることがあります

ささらさんの語尾の「だね」の不自然さの処理の仕方

「ね」の子音の「n」のPITを境界線の下くらいまで下げると程よくなります。
お好みで、「ね」の母音「e」のPITやLENをいじるといいと思います。

ONEちゃんの語尾

ONEちゃんの語尾に「?」を付けると語尾がいい感じに上がって可愛くなります。お勧め!

語尾の余韻について

言葉尻が間延びしていると感じる場合は、語尾のLENを少し短めに調節する事で改善できますが、LENでの調節だと音を切ってしまい言葉に余韻が無くなります。
ですので場合によっては、語尾のVOLを少し小さくすることによって余韻を残しながら語尾を短くした方が、自然になることがあります。

「、」の空白の長さについて

CeVIOは読点を挟まずに喋らせると連々と間を入れずに読んでしまうので、間を入れたいところに読点(「、」)を入れます。
ですが、ただ読点を入れただけでは、直前の語尾は間延びしてしまうし、間も大き過ぎてテンポも悪くなります。
そういう時は、①読点の前の母音と②読点で出来た間のLENを短くすることで、改善できると思います。
LENを短くする際は、境界線(音素グラフの色の明暗の分かれる真ん中あたりの線)を目安にするといいです。

TIPS
なお、CSバージョン6より、「、」や「。」や「 」のデフォルトの長さを変更できるようになりました。
「ツール」→「オプション」→「トーク設定」タブ→「ポーズの設定」ボタン
デフォルトの長さが、全体的に長すぎるとか短すぎると思う場合は、ここでデフォルトを微調整できます。

無声化について


日本語の文章では、本来母音が発音されるはずの部分で、母音の発声を省略する(喉を震わせない発音しかしない)場合があります。これを無声化といいます。
例:「好き」は本来「suki」という発音ですが、「s ki」のように聞こえます。
CeVIOの無声化は、(ボイロの無声化と異なり、)カ行、サ行、タ行、ハ行のみ無声化できます(本来の意味での無声化。)

CeVIOでは一定の日本語ルールに基づいて無声化が自動で再現されます。「音素単位で調整」有効時、無声化された母音は大文字のアルファベットで表示されます。
例:「好きです」→「s U k i d e s U」

自動で無声化されない場合に、任意に設定することもできます。以下の2種類の方法があります。

  1. 単語登録、ルビ指定時に「’」(全角記号)を入力する。
  2. 無声化が必要な音の母音のVOLを0にする。キャラによっては子音やLENも調整するなど微修正が必要です。

※詳しくは→「日本語の発音

「はーい」など長音符のつくセリフの作り方

「はーーーーい」などと長音符を連続で入力すると、「はああああい」と認識されてしまい、音が激しく揺れてしまいます。
そこで長音符(「ー」)の使用は最小限にし、LENで音の長さをいじることによって伸ばす音を作ります。
  • 短く「はーい」と言わせる場合
    音素グラフは[haai]となります。二つ目の[a]のLENを伸ばし、[i]のPITが一番高くなるように調節して、二つの[a]のPITの高さが同じになる様に調節するとそれっぽく言ってくれると思います。
  • 長く「はーーーーーーーーい」と言わせる場合
    短く「はーい」と言わせる場合と同じくように「はーい」と入力します。音素グラフも同じく[haai]です。
    一つ目の[a]のLENを上限近くまで伸ばし、二つ目の[a]は0にします。
    あとはPITで[i]が一番高くなるように調節すれば完成です。


 CeVIO AI  CeVIO AIでは0.5sec.程度以上の長さに音素を伸ばすと合成に失敗して音が破綻したり、ノイズが乗ることがあります
0.5sec.以上に伸ばしたい場合は伸ばし棒を増やして調整してみてください。

英語トークの発音・読み


 CeVIO AI 
CeVIO AIトーク弦巻マキ」の読み登録・ルビは英語の発音音素表記を記入する必要があります。

英語トークボイスの発音音素表記は、英語ソングボイスで使われる発音音素表記とほぼ同じですが、
英語ソングエディタにある「音素入力パレット」は英語トークエディタには今の所ありません。


6. 最後に

感情表現を含め、細かな調声に関しては、調声している方の感性に左右される部分が大きいと思います。
ですので、こうすれば良い、という正解は存在しません。
頭の中でイメージした自分の理想の可愛い調声を再現するのは、絵を描くように、曲を作るように、そして動画を作るように、非常に困難です。
一行のセリフを自然に喋らせるだけでも、何回、何十回と聞き直し作業が続きます。ずっとやっていると心が折れたりもします。
ですので、調声には根気と、キャラクターへの愛が必要不可欠です。というか創作全般、なんでも根本的に一緒です。
苦痛になる様であれば、自分の楽しめるラインで妥協し、次のセリフの調声を始めるか、途中保存し、一旦ソフトを終了する事をお勧めします。
それが出来ないあなたはCeVIO調声沼にハマってしまった一人です。
ようこそ、CeVIOはいいぞ。


補足・TIPS


動画の音声ビットレートでケロケロすることがある



  • ニコニコ動画でAAC192kbpsで投稿すると、タカハシの声がケロる事があるそうです
    • より高音質設定でエンコードして投稿することで回避できます

セリフクリップ・プリセット・辞書登録などの使い分け


機能 反映される単位 文字列 ACC PIT・VOL コンディション・感情 名前 メモ
セリフクリップ セリフ行 -
プリセット パラメータ - - - -
パラメータのみ貼り付け セリフ行 - - - - -
辞書登録 単語 - - - -

セリフクリップ
  • セリフ単位での調声全部が保存できて使い回せる
  • メモも残せる
プリセット
  • パラメータ(コンディション・感情)だけ保存できて使い回せる
  • 名前がつけられる
  • デフォルトの設定に指定できる
  •  CeVIO AI  原稿の読み込みで指定できる
パラメータのみ貼り付け
  •  CeVIO AI  保存されないプリセットのようなもの
辞書登録
  • アクセントと読みの変更のみ


<このあとは>

<もっと詳しく知りたい>


<実際に作品をつくってみる>

以下のページで詳しく紹介しています。

<効率を上げたり、便利に使う>




  • ほらほらどんどん書いてこ!! いけいけどんどん!! -- 名無しさん (2016-03-03 17:56:01)
  • 最近手出したけど難しいね -- 名無しさん (2017-05-12 22:34:44)
  • 『イア』『オネ』を発音させる場合【トーク】メニューの【単語の登録】でめっちゃよくなったよ! -- トークスターター (2017-08-15 02:03:08)
  • ささらさんに「灯明」を発音させると、「とうもう」ってはつおんしない? -- 殺陣倉 (2020-10-31 21:25:29)
  • CS7から入ったのですが、2. 調声に入る前に(デフォルトの表情設定)のところの表情値ってCS6以前のものでしょうか。 -- 名無しさん (2020-11-16 20:46:27)
  • CS6でも 1.00 - 0.00 で値の表記が違いますね。 -- 名無しさん (2020-11-23 22:54:04)
  • やって初めてわかる難しさ。がんばろ -- 名無しさん (2022-01-12 00:06:26)
名前:
コメント:


最終更新:2022年11月14日 11:12