CeVIO AI・CeVIO Proの情報まとめ > 時系列 > 前史

Ⅰ. 前史

2018年12月14日――初めて広く発表

新しい音声合成システムを開発した旨と、そのデモ音声が発表されました。
今回の歌声の元となった歌声は、CeVIOの「さとうささら」と「IA」の元となった歌声と同じものです。
現行CeVIOの歌唱音声と比べて、音質が良く、また、元の歌声の歌い方をさらにリアルに再現できています。
この段階では、音声の合成に時間がかかってしまうことが課題でした。
技術的な研究成果は、2019年3月の「日本音響学会2019年春季研究発表会」にて発表されたそうです。

  • 公式リリース

  • 実際の音声

  • 詳しい取材記事(藤本健さん)




2019年4月28日――オリジナル曲のCDを発表

本技術の歌声を使ったオリジナル曲のCDが、初めてリリースされました。
メインボーカルに「さとうささら」、コーラスに「IA」を起用しています。
DTM情報サイト「DTMステーション」の藤本健さんが、本技術の開発者と協力して作成し、技術の実用性を試したものです。
CDの制作段階では、「UIはまったくできていない」「合成にはかなりの演算処理が必要となり、高速演算が可能なコンピュータでも5分の歌を合成するのに10時間近くがかかる」状態でしたが、CDが発表される頃には、「処理速度を約600倍に高速化することに成功したとのことで、実時間合成のメドも経ってきた」そうです。

  • 実際の音声

  • 詳しい取材記事(藤本健さん)

  • 分析記事(くろ州さん)




2019年10月9日――高速化の状況が判明

本技術の最新の開発状況(音声デモ含む)が、一般公開の場で発表されました。
音声合成が大幅に高速化しており、CeVIOと同じように、通常のノートパソコンでもほぼリアルタイム合成できるようです。
CeVIOに似た仮GUIが実装されていました。ピアノロールをもち、パラメータ調整もできるようです(ボリューム・ピッチ・タイミング(デュレーション)・ビブラートの周期と振幅など)。
操作面では、CeVIOよりもさらに進んだ点として、以下の新機能が実装されています。
  1. DAW連携
  2. “シンガーのテンション”のコントロールが強弱記号でできるようです。
ただし、通常のノートパソコンでも動かせるようにするために、「人間のようなリアルさ」は、上記の2019年4月までの音声ほど極端に高品質ではない可能性があります(詳しくは下記「技術的な説明」のVocoderの説明を参照)。

  • 「ICTイノベーションフォーラム2019」における発表
テーマ:AIビッグデータの最前線
発表タイトル:「ビッグデータを用いた深層学習に基づく統計的パラメトリック歌声合成技術の研究開発」(D-2)
発表者:中村 和寛 (株)テクノスピーチ

※この発表の内容は、2019年9月の日本音響学会秋季研究発表会で、すでに発表されていたようです。
2019年秋季研究発表会/2019 Autumn Meeting
発表内容の概要(PDF10ページ目の1-4-4「CNNに基づく歌声合成における計算量削減の検討」)
※「ICTイノベーションフォーラム2019」での発表は、国の補助金(総務省の戦略的情報通信研究開発推進事業(SCOPE))を受けた研究の報告会ということで、無料で一般公開されたため、音声合成ユーザーにも知られることとなりました。

  • 詳しい取材記事(くろ州さん)

  • 英語のまとめ・解説記事(uncreepyさん) English Roundup & Commentary

タグ:

CeVIO Pro CeVIO_AI
+ タグ編集
  • タグ:
  • CeVIO Pro
  • CeVIO_AI
最終更新:2022年10月31日 17:13