［招待講演］階層ベイズ音響・言語モデルに基づく教師なし音楽理解

吉井 和佳

講演名	2016-08-24 ［招待講演］階層ベイズ音響・言語モデルに基づく教師なし音楽理解吉井和佳(京大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では，教師なし音楽理解のための統計的アプローチについて述べる．我々の目標は，言語モデルと音響モデルとを内包する統一的な階層ベイズモデルを定式化することにより，音楽音響信号に対して自動採譜を行う，すなわち音符配置を推定すると同時に，音符配置の背後に存在する音楽文法を同時に推論することである．このアプローチは，音楽信号だけから自己組織的に音響モデル・言語モデルを教師なし学習するという点で，一般的な音声認識システムの枠組みよりは，音声信号からの言語獲得と関連が深い．したがって，音響信号に含まれる音符の個数や音楽文法の複雑さなどを，データに合わせて自動調節できる仕組みが不可欠である．本稿では，音響モデルや言語モデルの一例として，多重基本周波数解析やコード進行解析のためのノンパラメトリックベイズモデルを紹介する．さらに，これらを階層ベイズモデルとして統合する試みについて紹介する．
抄録(英)	This paper presents a statistical approach to unsupervised music understanding. Our goal is to estimate musical notes from music audio signals and induce music grammars from the estimated notes by formulating a unified hierarchical Bayesian model consisting of probabilistic acoustic and language models. Given music audio signals, both models are jointly trained in a self-organizing manner. In this paper, we introduce our nonparametric Bayesian acoustic and language models for multipitch analysis and chord progression analysis. We then explain how to unify those models in a hierarchical Bayesian manner.
キーワード(和)	音楽情報処理 / 多重基本周波数推定 / 自動採譜 / 文法獲得 / 確率的音響モデル / 確率的言語モデル / 階層ベイズ / ノンパラメトリックベイズ
キーワード(英)	music information processing / multipitch analysis / automatic music transcription / grammar induction / probabilistic acoustic model / probabilistic language model / hierarchical Bayes / nonparametric Bayes
資料番号	SP2016-29
発行日	2016-08-17 (SP)

研究会情報
研究会	SP
開催期間	2016/8/24(から2日開催)
開催地（和）	京都大学学術情報メディアセンター
開催地（英）	ACCMS, Kyoto Univ.
テーマ（和）	音響イベント処理，一般
テーマ（英）	Audio event processing, etc.
委員長氏名（和）	間野一則(芝浦工大)
委員長氏名（英）	Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名（和）	森大毅(宇都宮大)
副委員長氏名（英）	Hiroki Mori(Utsunomiya Univ.)
幹事氏名（和）	滝口哲也(神戸大) / 西田昌史(静岡大)
幹事氏名（英）	Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名（和）	浅見太一(NTT) / 橋本佳(名工大)
幹事補佐氏名（英）	Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会	Technical Committee on Speech
本文の言語	JPN
タイトル（和）	［招待講演］階層ベイズ音響・言語モデルに基づく教師なし音楽理解
サブタイトル（和）
タイトル（英）	[Invited Talk] Unsupervised Music Understanding based on Hierarchical Bayesian Acoustic and Language Models
サブタイトル（和）
キーワード(1)（和/英）	音楽情報処理 / music information processing
キーワード(2)（和/英）	多重基本周波数推定 / multipitch analysis
キーワード(3)（和/英）	自動採譜 / automatic music transcription
キーワード(4)（和/英）	文法獲得 / grammar induction
キーワード(5)（和/英）	確率的音響モデル / probabilistic acoustic model
キーワード(6)（和/英）	確率的言語モデル / probabilistic language model
キーワード(7)（和/英）	階層ベイズ / hierarchical Bayes
キーワード(8)（和/英）	ノンパラメトリックベイズ / nonparametric Bayes
第 1 著者氏名（和/英）	吉井和佳 / Kazuyoshi Yoshii
第 1 著者所属（和/英）	京都大学(略称：京大) Kyoto University(略称：Kyoto Univ.)
発表年月日	2016-08-24
資料番号	SP2016-29
巻番号（vol）	vol.116
号番号（no）	SP-189
ページ範囲	pp.13-18(SP),
ページ数	6
発行日	2016-08-17 (SP)