音 - (2009/12/15 (火) 17:06:39) の編集履歴(バックアップ)
思いついたことのコーナー
RULE:
- 誰でもいいのガンガン書いてくださいな。思い浮かんだら即書いてみる。
- できるとかできないとか関係なしに。
- 五月祭期間中twitterから情報を取り出してしゃべらせる。(音声合成)
handle name とかわかる情報から音声を決める。例えば性別とか
- 物理的に音波の掛け算もしくは相関計算が可能ならば連想記憶の方法を用いて音の再生が可能ではないか?
ホワイトノイズと信号の相関を累積したものから信号を取り出す。
→どうやら音で相関計算をするのは厳しいので断念。
(光に変えてやってやればいいようですがPCで計算したほうがはるかに速いので…)
→どうやら音で相関計算をするのは厳しいので断念。
(光に変えてやってやればいいようですがPCで計算したほうがはるかに速いので…)
近況
12月 二年生勧誘
資料作成及び配布
とりあえず一月までに2年も含めた顔合わせができるとよし。
資料作成及び配布
とりあえず一月までに2年も含めた顔合わせができるとよし。
システム一研との話し合い
- 立体迷路はどうか?
→「右、左」というとその通り動く(音声認識をつかう:julian? or DPmatching)
- Vocal Transformerはどうか?→ピッチ抽出はできるのでハーモナイザーはすぐできる。
- ピッチ抽出→MIDIなどの他楽器で演奏
- 音で絵をかく→横、縦をどんな特徴量であらわすか?
- 音声合成はきつい
人間にとって当たり前 BUT 機械ではむずい
- 音声認識はnoiseの問題が
誤ることが前提で考える→誤ることを逆手にとる
- 見せ方
人間にできないこと
グラフィックを使う
実時間のシステムが一番いい、interactiveに!!
グラフィックを使う
実時間のシステムが一番いい、interactiveに!!
資料
とりあえず、音声認識関連の本を2冊ほど購入したので見たい人は
計数ロッカー室のMayfesのロッカーに入れておきますのでどうぞ。
割と軽めです。
ない時は誰かが読んでるということで。
物工の人は誰か計数の人に頼んでロッカー室開けてもらってください。
物工の人にはご迷惑おかけします。
{『音響学ABC』(技術堂出版)
『フリーソフトで作る音声認識システム』(森北出版株式会社)}
計数ロッカー室のMayfesのロッカーに入れておきますのでどうぞ。
割と軽めです。
ない時は誰かが読んでるということで。
物工の人は誰か計数の人に頼んでロッカー室開けてもらってください。
物工の人にはご迷惑おかけします。
{『音響学ABC』(技術堂出版)
『フリーソフトで作る音声認識システム』(森北出版株式会社)}
<現在上がっている案>
- 去年の展示物の改良(音を信号処理して様々な特徴量を出してシューティングゲームにしたもの)
とりあえず今はピッチ検出をしてみてます。 いろいろ信号処理のことのってます。
- 声道を複数の円筒管をつなげたものによって伝達関数だけ同じにしてみる。
要はモノマネができる原理です。インコとかも同じ。
- ワイングラスを共振で割ってみる。
安全性から許可下りないかも。 共振で発電をしてみるのも手かと。 液体窒素とかで凍らせたらいろいろ割れんじゃねとも思う。林檎とか。
- 音声認識でいろいろ
それなりに限られた文、単語なら高認識率なのでARと合わせて何か出来るかも。
- ペイントなどに書いた曲線を音に畳みこむor掛け算してみる。(時間領域、周波数領域)
割と面白そうなんですが、すぐできちゃうので最終手段で
- 録音された各楽器のパートを組み合わせて音楽を作ってみる
録音された各楽器のパートを特徴量からラべリングしてそれらの組み合わせを出してみる。おもにクラスタリング、相関度検出などになると思います。
- 「あ行」から「か~わ行」まで作る。
母音から子音+母音を作るということです。 サンプルが母音だけで、トークロイドが作れることを目標に。 (追記: 2009/12/01)
とりあえずは以上があがってますが、ボーカルトランスフォーム、楽音関係なども考えてます。実現可能性は無視でいいのでアイディアがあったら書き込んでくださってOKです。
以上 中村友彦でした。
以上 中村友彦でした。
(追記: 2009/11/16)
声道モデルの資料の一つです。
とりあえず今あげられる資料でいいものがないのですが言葉だけでは分かりにくいという方のために。
ただし、今のところ下のpdfの様に声道モデル以外も作るということはしませんし、声道を時間的に動かしたりはする予定はありません。
http://www.interaction-ipsj.org/archives/paper2002/pdf2002/27sawada.pdf
声道モデルの資料の一つです。
とりあえず今あげられる資料でいいものがないのですが言葉だけでは分かりにくいという方のために。
ただし、今のところ下のpdfの様に声道モデル以外も作るということはしませんし、声道を時間的に動かしたりはする予定はありません。
http://www.interaction-ipsj.org/archives/paper2002/pdf2002/27sawada.pdf
(追記: 2009/11/26)
誰かが掲示板に載せてくれたのが面白いので、これも自動化してmidiでやってみようかなとか思いだす今日この頃。
http://gigazine.net/index.php?/news/comments/20091010_speaking_piano
誰かが掲示板に載せてくれたのが面白いので、これも自動化してmidiでやってみようかなとか思いだす今日この頃。
http://gigazine.net/index.php?/news/comments/20091010_speaking_piano
<参考書>
基本的には線形理論(LPC,PARCOR,LSP?)、統計学的手法(HMM,AR過程)をつかって行こうと思うのでよさげなのを書いておきます。(?は使うかどうか不明なとこです。)
{『音声信号処理』(今村 聖、森川出版)
『音声の線形予測』( J.D.マーケル, A.H.グレイ,Jr.著 ; 鈴木久喜訳)}
{『音声信号処理』(今村 聖、森川出版)
『音声の線形予測』( J.D.マーケル, A.H.グレイ,Jr.著 ; 鈴木久喜訳)}