講演名 2012-11-07
音楽音響信号解析のためのガンマ過程に基づく無限複合自己回帰モデル(第15回情報論的学習理論ワークショップ)
吉井 和佳, 後藤 真孝,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,音楽音響信号に含まれる複数の基本周波数(F0)を推定したり,音楽音響信号を音色ごとに分離したりするための確率モデルについて述べる.本モデルは,ソース・フィルタ理論に基づく非負値行列因子分解(NMF)を拡張したものであり,観測スペクトログラムを二種類のスペクトル(ソースおよびフィルタ)とそれらの組み合わせに対する時間変化との積へ分解できる.ここで,楽器の発音機構は自己回帰システムであると仮定すると,F0をもつ周期信号(くし型スペクトル)や白色雑音(平坦スペクトル)などのソースにより,楽器の音色を表現する全極型フィルタが駆動されることで多様な楽器音が生成・重畳される過程を考えることになる.しかし,従来は,音響信号に含まれるソースやフィルタの個数が未知である場合でも,事前に指定しておく必要があった.本研究では,ガンマ過程を用いることで,上限のない個数のソースやフィルタを許容可能なノンパラメトリックベイズモデルである無限複合自己回帰モデル(iCARM)を提案する.本モデルの学習のため,変分ベイズ法(VB)と乗法更新則(MU)を組み合わせた効率的な反復最適化アルゴリズムを導出し,スパースな推定が行えることを実験により確認した.
抄録(英) This paper presents novel statistical models that can be used for multiple fundamental frequency (F0) estimation and timbre-based source separation of polyphonic music signals. These models are based on nonnegative matrix factorization (NMF) extended by the source-filter paradigm, in which an amplitude or power spectrogram is decomposed as the product of two kinds of spectral atoms (sources and filters) and time-varying gains of source-filter pairs. However, a critical problem is that the numbers of sources and filters should be given in advance. To solve this problem, we propose nonparametric Bayesian models based on gamma processes and efficient variational and multiplicative learning algorithms. These infinite composite autoregressive models (iCARMs) can discover effective numbers of sources and filters in a data-driven manner.
キーワード(和) 音楽音響信号解析 / 基本周波数推定 / 音源分離 / ガンマ過程 / ノンパラメトリックベイズ
キーワード(英) Music signal analysis / F0 estimation / source separation / gamma process / nonparametric Bayes
資料番号 IBISML2012-51
発行日

研究会情報
研究会 IBISML
開催期間 2012/10/31(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) 音楽音響信号解析のためのガンマ過程に基づく無限複合自己回帰モデル(第15回情報論的学習理論ワークショップ)
サブタイトル(和)
タイトル(英) Infinite Composite Autoregressive Models based on Gamma Processes for Music Signal Analysis
サブタイトル(和)
キーワード(1)(和/英) 音楽音響信号解析 / Music signal analysis
キーワード(2)(和/英) 基本周波数推定 / F0 estimation
キーワード(3)(和/英) 音源分離 / source separation
キーワード(4)(和/英) ガンマ過程 / gamma process
キーワード(5)(和/英) ノンパラメトリックベイズ / nonparametric Bayes
第 1 著者 氏名(和/英) 吉井 和佳 / Kazuyoshi YOSHII
第 1 著者 所属(和/英) 産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
第 2 著者 氏名(和/英) 後藤 真孝 / Masataka GOTO
第 2 著者 所属(和/英) 産業技術総合研究所
National Institute of Advanced Industrial Science and Technology (AIST)
発表年月日 2012-11-07
資料番号 IBISML2012-51
巻番号(vol) vol.112
号番号(no) 279
ページ範囲 pp.-
ページ数 8
発行日