講演名 2003/6/20
ガウス混合モデルを用いた楽曲のコード認識(信号処理,LSI,及び一般)
菅野 真音, 白井 啓一郎, 長井 隆之, 池原 雅章,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,ガウス混合モデル(GMM)を用いて楽曲のコードを認識する手法を提案し,実験検討結果を報告する.フレーム分割した入力音響信号を,フィルタバンクを用いてオクターブ毎に分割し,各オクターブから12音名に対応するパワースペクトルを12次元のベクトルとして抽出する.このベクトルより混合重み,平均ベクトル,共分散行列を求め,ガウス混合モデルを形成する.さらにN-gramモデルを併用することにより,コード進行を考慮したモデルとする.以上より,未学習の音域に対して適応可能であり,将来的に複雑な構成音の場合やリアルタイムでの認識を考慮した手法を提案する.
抄録(英) In this paper, the method of recognizing the chord of a musical piece using a gaussian mixture model (GMM) is proposed, and an experiment examination result is reported. The input sound signal from frame division is divided for every octave using filterbank, and the power spectrum corresponding to 12 sound name is extracted as a 12-dimensional vector from each octave. It asks for mixed dignity, an average vector, and a covariance matrix from this vector, and GMM is formed from these. Additionally, by using N-gram model together, the model is in consideration of chord progression. And above, it can be adapted to non-learned range, and the method of the case of a complicated composition sound on real time into consideration in the future is proposed.
キーワード(和) ガウス混合モデル / N-gramモデル / 和声認識 / ピッチ抽出 / 音楽理解
キーワード(英) gaussian mixture model / N-gram model / chord recognition / pitch extraction / music understanding
資料番号 CAS2003-26,VLD2003-36,DSP2003-56
発行日

研究会情報
研究会 VLD
開催期間 2003/6/20(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 VLSI Design Technologies (VLD)
本文の言語 JPN
タイトル(和) ガウス混合モデルを用いた楽曲のコード認識(信号処理,LSI,及び一般)
サブタイトル(和)
タイトル(英) Chord Recognition Using Gaussian Mixture Model
サブタイトル(和)
キーワード(1)(和/英) ガウス混合モデル / gaussian mixture model
キーワード(2)(和/英) N-gramモデル / N-gram model
キーワード(3)(和/英) 和声認識 / chord recognition
キーワード(4)(和/英) ピッチ抽出 / pitch extraction
キーワード(5)(和/英) 音楽理解 / music understanding
第 1 著者 氏名(和/英) 菅野 真音 / Masato SUGANO
第 1 著者 所属(和/英) 慶應義塾大学
Keio University
第 2 著者 氏名(和/英) 白井 啓一郎 / Keiichiro SHIRAI
第 2 著者 所属(和/英) 慶應義塾大学
Keio University
第 3 著者 氏名(和/英) 長井 隆之 / Takayuki NAGAI
第 3 著者 所属(和/英) 電気通信大学
The University of Electro-Communications
第 4 著者 氏名(和/英) 池原 雅章 / Masaaki IKEHARA
第 4 著者 所属(和/英) 慶應義塾大学
Keio University
発表年月日 2003/6/20
資料番号 CAS2003-26,VLD2003-36,DSP2003-56
巻番号(vol) vol.103
号番号(no) 145
ページ範囲 pp.-
ページ数 6
発行日