「交流掲示板ログ保管庫4」の編集履歴(バックアップ)一覧に戻る
交流掲示板ログ保管庫4 - (2009/06/28 (日) 13:58:13) の編集履歴(バックアップ)
- ビブラートの機能要望 - ななし
- 一音の中に二文字の歌詞を入れる場合 - 初心者
- wavsplitとvsq2txtについて - 七瀬
- 度々申し訳ありません。 - アキ
- ファイルにチャックのようなものが。。。。 - プロシア
- Lengthの値について - 初心者
- UTAUで音源が変わらない? - みけCAT
- ボビー・オロゴン登場・・・orz - MINAMI☆
- UTAUが使えなくなりました - あめや
- 休符のオーバーラップについて - ツナ
- 別撮りしたピアノと作ったテトちゃんをあわせる方法 - まぁーか
- 音名に使えない文字 - 魅亜
- 教えて下さいっ! - アキ
- 叶わぬ願い - ken
- Mode2の使い方について - ken
- 連続発声したwavの利用など - 耳ロボP Home
Mode2の使い方について - ken
2009/05/28 (Thu) 17:45:57
Mode2でカスタムにして点を5前後で使っているのですが、開始点の音程だけ変えることができません。
どのように対処したらよいでしょうか。
どのように対処したらよいでしょうか。
Re: Mode2の使い方について - キハ22
2009/05/28 (Thu) 23:15:44
kenさん、こんばんは。
mode2ポルタメントの左端と右端の点はピッチは固定です。それは仕様です、という感じです。
mode2ポルタメントの左端と右端の点はピッチは固定です。それは仕様です、という感じです。
この仕様で http://www.nicovideo.jp/watch/sm7020856 のような設定は可能です。
なお、思考実験としては、先行する音符の音量をゼロに、かつオーバーラップでもう一つ前の音符に大きく重ねるという邪法でポルタメント左端の点の音程を操作できると思いました。
Re: Mode2の使い方について - ken
2009/05/28 (Thu) 23:31:33
キハ22さん、ありがとうございます。
この視点でもう一度上記の動画を拝見しました。
お教えいただいた方法、試してみます。
ひとつの曲でMode2 ON/OFF が混在できればよいのですが、そこまで我侭も言えないので、キャッシュを残して切り替えながら重ねることも考えています。
この視点でもう一度上記の動画を拝見しました。
お教えいただいた方法、試してみます。
ひとつの曲でMode2 ON/OFF が混在できればよいのですが、そこまで我侭も言えないので、キャッシュを残して切り替えながら重ねることも考えています。
Re: Mode2の使い方について - ken
2009/05/29 (Fri) 17:23:14
1 ポルタメント前半部分を前の音節にシフトし、エンベロープの尻尾を無音化する
2 前の音節の尻尾を分割し、ダミーの音節を作る
左下の数値を参考にオーバーラップを設定する
ダミーのエンベロープを操作し、無音化する
テストの結果どちらのの方法でもいけそうです。
バランスを取るのが難しいですが、Mode2のみでもいけそうです。ありがとう。
2 前の音節の尻尾を分割し、ダミーの音節を作る
左下の数値を参考にオーバーラップを設定する
ダミーのエンベロープを操作し、無音化する
テストの結果どちらのの方法でもいけそうです。
バランスを取るのが難しいですが、Mode2のみでもいけそうです。ありがとう。
連続発声したwavの利用など - 耳ロボP Home
2009/05/19 (Tue) 07:40:49
こんにちは。いつもお世話になっております。
最近UTAUの音質向上について桃音モモの藤本さんとあれこれ考えてみたり調べてみたりしています。
特に、ボイスライブラリの「あ.wav」「い.wav」といった単独発声を「あいうえお.wav」のような連続発声にすることで、発音や音のつながりをもっと滑らかにできないだろうかと思い、UTAUでの実現方法案を考えたり実験してみたりしています。
しっかりした結論が出たわけではないのですが、ひとまず一つの案とサンプル音ができましたので、レポートをお送りします。内容に何かと不備があるかもしれませんが、よろしければ説明PDFと音サンプルをご覧いただければ幸いです。
- パスワード=UTAU
- zip内に各種wavやPDFなどが入っています。
使用したバージョンは 0.2.36 です。
また、合成音を作成した際に、波形のオーバーラップ区間で振幅が小さくなるという現象が出ました。多分、重ねる波形間の位相のずれが原因だと思います。詳細はzip内のPDF資料で述べています。
また、合成音を作成した際に、波形のオーバーラップ区間で振幅が小さくなるという現象が出ました。多分、重ねる波形間の位相のずれが原因だと思います。詳細はzip内のPDF資料で述べています。
もし何かお気づきの点などありましたらコメントいただければ幸いです。よろしくお願いします。
Re: 連続発声したwavの利用など - キハ22
2009/05/19 (Tue) 10:35:57
興味深いものをありがとうございます。とりいそぎ手元で再生できるようにして再生してみました。
母音の遷移については欲しいと思っています。今自分でUTAわせて、「あい」と「あお」が聴いてテラ切り貼りな感じで困っています。5点エンベロープ併用で長い長いオーバーラップを取っても人の耳をごまかすのはつらい感じです。
いろいろなライブラリーが「いぇ」を持っているのは助かっているかも知れません。
例の「き-いぇ-る-ひ-こ-き-ぐ-も」です。
例の「き-いぇ-る-ひ-こ-き-ぐ-も」です。
PDFのご意見、同意できるところがあります。人の滑舌を超えた発声の「神調教」も合成歌唱の音楽表現として、シンセサイザーの器楽演奏同様に価値のあるものですが、それとは別の表現の方向として「まるで人」を目指すなら、母音の遷移はもうちょっと何とかなると嬉しいと思います。
結論を急ぐ必要もないと思いますが、あまりにも複雑なものはUSTを組んでいられないので、割り切った対処が実用的だと思います。
自分がライブラリーに追加されて欲しいと思うのは「あ」「い」「う」「え」「お」の2音間の遷移の全組合せです。
「あい.wav」「あう.wav」「あえ.wav」「あお.wav」,「いあ.wav」「いう.wav」「いえ.wav」「いお.wav」,「うあ.wav」「うい.wav」「うえ.wav」「うお.wav」,「えあ.wav」「えい.wav」「えう.wav」「えお.wav」,「おあ.wav」「おい.wav」「おう.wav」「おえ.wav」です。
遷移がおわるまでが固定部、うしろがわの母音は可変長部です。前側の母音の長さは40ミリ秒程度で続く遷移が速い原音が使い勝手がよいと思います。これでピアノロール画面では「さ」行の音と同じくらいの場所を占めると思います。遷移の終わりまでをオーバーラップ区間とします。
これを使ってエンベロープとオーバーラップでごまかせる範囲でがんばる。それ以上は、別途の音声合成技術(たとえばVOCALOIDエンジンが使う「周波数ドメイン歌唱アーティキュレーション接続法」)に任せるのがいいかな、と思っています。
Re: 連続発声したwavの利用など - ken
2009/05/19 (Tue) 15:27:40
資料DLさせていただきました。皆さんに比べ技量・感性とも劣る身ながら、
「神調教」ではなく「まるで人が歌っているよう」を目指す者としましては、
この試みを応援したいと思います。(ただ応援するだけしかできませんが)
「神調教」ではなく「まるで人が歌っているよう」を目指す者としましては、
この試みを応援したいと思います。(ただ応援するだけしかできませんが)
Re: 連続発声したwavの利用など - 魅亜
2009/05/19 (Tue) 18:03:03
職場からこんにちは(仕事しろ)
音声ファイルを聞けてない状態ですみません。
まず、実験されているお二方の行動力に敬服します。
音声ファイルを聞けてない状態ですみません。
まず、実験されているお二方の行動力に敬服します。
私はどちらかといえば滑舌の(過剰な)明瞭さをUTAUという楽器の特性として生かす派なのですが、
外国語を扱うに当たり音の連結に壁を感じているので試みには共感できます。
外国語を扱うに当たり音の連結に壁を感じているので試みには共感できます。
2音素以上を持つ原音を用いた合成は、英語など中間音を多く含む外国語では必須であると考えています。
ただ、その原音を選択するI/Fとして単純な文字列置換でいけるほど単純かどうか気になります。
つまり、日本語の場合でも必要な組み合わせがキハ22さんのおっしゃる「5母音間の順列」ではすまないのでは?という懸念です。
ただ、その原音を選択するI/Fとして単純な文字列置換でいけるほど単純かどうか気になります。
つまり、日本語の場合でも必要な組み合わせがキハ22さんのおっしゃる「5母音間の順列」ではすまないのでは?という懸念です。
「あい」を例にとると
- 「強母音+弱母音の二重母音」
- 「い」にアクセントがあり、二重母音化しない
- 「い」が硬口蓋化する(次に別の母音がくる場合など)
のそれぞれで口の動きが違い、従って違う原音が必要なのでは? と思うのです。
そのあたりは整備の手間、使い勝手の点から割り切るべきところなのかもしれませんが……。
そのあたりは整備の手間、使い勝手の点から割り切るべきところなのかもしれませんが……。
外国語の場合にはここを割り切るわけにもいかないところがあってさらに悩みが深いです。
後半、クロスフェード部の振幅減少は言われてみればよく遭遇していました。同じ音を微妙に違うパラメータでちょっとずらして(全体をオーバーラップさせて)同時発声させたりすると顕著ですね。
これも過剰に明瞭な発音の一因かなとも思いますが対処は難しそうですね。
これも過剰に明瞭な発音の一因かなとも思いますが対処は難しそうですね。
ピッチを合わせるとなるとmod0, Y0でまず単純化する必要があると思いますがそれは「人のような歌唱」とは正反対の調整ですし。
一旦単純化して重ねた上で新たに揺らぎの変調をかけるとか?
(うわあ面倒くさそう)
(うわあ面倒くさそう)
「まるで人が歌っているよう」を目指すなら - あめや
2009/05/20 (Wed) 00:10:36
興味深い試みです。
UTAU作者的回答は後回しにして、思いだしたことは、
VOCALOIDでは例えは、同じ音(音階、歌詞、パラメータ)でも次に来る音が「い段」だと(母音じゃなくても)波形がかなり前から変化しだすことを発見したことがありました。
これはこれ自体を突っ込んで検証したわけでは無いので「ありました」で終わりなんですが、こういう接続の仕方が有効なのは二重母音だけじゃなさそうですね。
UTAU作者的回答は後回しにして、思いだしたことは、
VOCALOIDでは例えは、同じ音(音階、歌詞、パラメータ)でも次に来る音が「い段」だと(母音じゃなくても)波形がかなり前から変化しだすことを発見したことがありました。
これはこれ自体を突っ込んで検証したわけでは無いので「ありました」で終わりなんですが、こういう接続の仕方が有効なのは二重母音だけじゃなさそうですね。
さて、クロスフェードの位相のズレの問題ですが、
実は夕日坂のとき、初めてオーバーラップを導入したときから認識はしていました。
が、自動調整は構造上難しいですね。やるとしたらかなりゴリ押しの実装になります。
現実的な選択としては、タイミング調整の精度をマイクロ秒まで上げてマニュアルでやってもらうことでしょうか?
実は夕日坂のとき、初めてオーバーラップを導入したときから認識はしていました。
が、自動調整は構造上難しいですね。やるとしたらかなりゴリ押しの実装になります。
現実的な選択としては、タイミング調整の精度をマイクロ秒まで上げてマニュアルでやってもらうことでしょうか?
Re: 連続発声したwavの利用など - ken
2009/05/20 (Wed) 20:46:19
えーと。プロパティーで0.25/480が調整の限界ですよね。テンポ120で四分音符が0.5秒だから250μs
- 本体では無理ですね。
クロスフェードは原音を何らかのツールを用いて手動で・・orz
そういう補助ソフトできませんか・・無理ですかorz
そういう補助ソフトできませんか・・無理ですかorz
Re: 連続発声したwavの利用など - 耳ロボP Home
2009/05/21 (Thu) 08:24:38
ご意見等ありがとうございます。
振幅に関しては、ひとまず手動ででも微調整できるようになればとても助かります。うまくやればタイミングの調整は外部プログラムでもなんとか自動化(半自動化?)できるかもしれませんし。例えば、batをいじることになるのかもしれませんが、wavtoolで波形をつなげる前に、接続波形を少しずつずらしながら誤差が最小(または相関係数が最大)になる位置を探して、その値をwavtoolに渡せると良いのかなと思いました。
トライグラムですべてのパターンを網羅するのは大変なので、「あい.wav」のようなバイグラム辺りが現実的なのかもしれませんね。いずれにしてもファイルが存在するかどうかでトライグラム、バイグラム、モノグラムを切り替えられるとベストだろうと思いました。
Re: 連続発声したwavの利用など - 藤本萌々子 Home
2009/05/22 (Fri) 01:11:41
耳ロボPさん、みなさま、お疲れ様です。
ファイルが存在するかどうかでトライグラム、バイグラム、モノグラムを切り替えられるとベストだろうと思いました。
素人考えですが、私もそれができたらいいなと感じました。
今回の検証内容はすぐに具体的に進めることのできる話ではないのかもしれませんが、検証や実験のための素材でしたらいつでも用意しますので、必要なさいには声をかけていただけたらと思います。
Re: 連続発声したwavの利用など - ken
2009/06/02 (Tue) 17:32:56
0.2.43の先行発声の分解能が大幅にアップされ、22.6μになりました。
この値は440Hzの波一個分のほぼ1/100なので、
支援していただいているのだと思います。
この値は440Hzの波一個分のほぼ1/100なので、
支援していただいているのだと思います。