MFCC領域におけるGMMクラスタリングを併用したNon-negative Matrix Factorizationによる雑音環境下音声認識

藤垣,健太郎; 柏木,陽佑; 齋藤,大輔; 峯松,信明; 広瀬,啓吉

お知らせ 2023年度・2024年度学生員会費割引キャンペーン実施中です
お知らせ技術研究報告と和文論文誌Ｃの同時投稿施策(掲載料1割引き)について
お知らせ電子情報通信学会における研究会開催について
お知らせ NEW 参加費の返金について

電子情報通信学会研究会発表申込システム
講演論文詳細

技報閲覧サービス
[ログイン]
技報アーカイブ

トップに戻る

前のページに戻る

[Japanese] / [English]

講演抄録／キーワード
講演名		2014-12-16 11:00 MFCC領域におけるGMMクラスタリングを併用したNon-negative Matrix Factorizationによる雑音環境下音声認識 ○藤垣健太郎・柏木陽佑・齋藤大輔・峯松信明・広瀬啓吉（東大） SP2014-113
抄録	（和）	雑音環境下音声認識において，事例ベースの特徴量強調としてNon-negative Matrix Factorization (NMF) を用いた手法が検討されている．スペクトル領域において雑音が加算性であることを利用し，雑音重畳音声のスペクトルを多数の音声基底，雑音基底とそのスパースな重み行列に分解することでクリーン音声を再構成する手法である．従来のNMF では，初期値を与え，これを繰り返し更新することで最終結果を得る。このとき，その音声の音素を教師として利用することができれば，基底や重み行列を音素依存で推定でき，より高精度に計算することが期待される．しかし，音声認識のタスクにおいて音素は認識すべき対象であり，事前には得られない．そこで本稿では，MFCC 領域でのGaussian Mixture Model (GMM) クラスタリングを併用したNMF を提案する．音素情報の代わりに，MFCC領域におけるGMM クラスタリングによって得られたクラス情報を用いて基底を準備することで，従来のNMF に比べて認識率を向上できることを示す．
	（英）	Exemplar-based feature enhancement by non-negative matrix factorization (NMF) was proposed for noise-robust speech recognition. When we consider only additive noises, we can decompose a noisy speech spectrum into a linear but sparse combination of speech and noise bases. In the conventional NMF, decomposition is unsupervised. If we can give the phoneme sequence of an input utterance to the NMF processing, it is surely possible to realize much more precise decomposition. However, in the task of speech recognition, the phoneme sequence is unknown and unavailable. In this paper, therefore, we introduce unsupervised GMM clustering and classify each input frame by using GMM indexes. For NMF, speech bases are built separately for each GMM index. Experiments show that our proposed method of combining NMF with GMM clustering gives higher robustness of recognizing noisy speech than the original NMF.
キーワード	（和）	雑音環境下音声認識 / 雑音抑圧 / 特徴量強調 / NMF / GMMクラスタリング / / /
	（英）	robust speech recognition / noise surpression / feature enhancement / NMF / GMM clustering / / /
文献情報		信学技報, vol. 114, no. 365, SP2014-113, pp. 69-74, 2014年12月.
資料番号		SP2014-113
発行日		2014-12-08 (SP)
ISSN		Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380
著作権について		技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します．(許諾番号：10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード		SP2014-113

研究会情報
研究会	NLC IPSJ-NL SP IPSJ-SLP JSAI-SLUD
開催期間	2014-12-15 - 2014-12-17
開催地（和）	東工大（すずかけ台）
開催地（英）	Tokyo Institute of Technology (Suzukakedai Campus)
テーマ（和）	第6回集合知シンポジウム
テーマ（英）	The 6th Symposium on Collective Knowlege
講演論文情報の詳細
申込み研究会	SP
会議コード	2014-12-NLC-NL-SP-SLP-SLUD
本文の言語	日本語
タイトル（和）	MFCC領域におけるGMMクラスタリングを併用したNon-negative Matrix Factorizationによる雑音環境下音声認識
サブタイトル（和）
タイトル（英）	Noise robust speech recognition by non-negative matrix factorization using GMM clustering in MFCC domain
サブタイトル（英）
キーワード(1)（和/英）	雑音環境下音声認識 / robust speech recognition
キーワード(2)（和/英）	雑音抑圧 / noise surpression
キーワード(3)（和/英）	特徴量強調 / feature enhancement
キーワード(4)（和/英）	NMF / NMF
キーワード(5)（和/英）	GMMクラスタリング / GMM clustering
キーワード(6)（和/英）	/
キーワード(7)（和/英）	/
キーワード(8)（和/英）	/
第1著者氏名（和/英/ヨミ）	藤垣健太郎 / Kentaro Fujigaki / フジガキケンタロウ
第1著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： Univ. of Tokyo)
第2著者氏名（和/英/ヨミ）	柏木陽佑 / Yosuke Kashiwagi / カシワギヨウスケ
第2著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： Univ. of Tokyo)
第3著者氏名（和/英/ヨミ）	齋藤大輔 / Daisuke Saito / サイトウダイスケ
第3著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： Univ. of Tokyo)
第4著者氏名（和/英/ヨミ）	峯松信明 / Nobuaki Minematsu / ミネマツノブアキ
第4著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： Univ. of Tokyo)
第5著者氏名（和/英/ヨミ）	広瀬啓吉 / Keikichi Hirose / ヒロセケイキチ
第5著者所属（和/英）	東京大学 (略称：東大) The University of Tokyo (略称： Univ. of Tokyo)
第6著者氏名（和/英/ヨミ）	/ /
第6著者所属（和/英）	(略称： ) (略称： )
第7著者氏名（和/英/ヨミ）	/ /
第7著者所属（和/英）	(略称： ) (略称： )
第8著者氏名（和/英/ヨミ）	/ /
第8著者所属（和/英）	(略称： ) (略称： )
第9著者氏名（和/英/ヨミ）	/ /
第9著者所属（和/英）	(略称： ) (略称： )
第10著者氏名（和/英/ヨミ）	/ /
第10著者所属（和/英）	(略称： ) (略称： )
第11著者氏名（和/英/ヨミ）	/ /
第11著者所属（和/英）	(略称： ) (略称： )
第12著者氏名（和/英/ヨミ）	/ /
第12著者所属（和/英）	(略称： ) (略称： )
第13著者氏名（和/英/ヨミ）	/ /
第13著者所属（和/英）	(略称： ) (略称： )
第14著者氏名（和/英/ヨミ）	/ /
第14著者所属（和/英）	(略称： ) (略称： )
第15著者氏名（和/英/ヨミ）	/ /
第15著者所属（和/英）	(略称： ) (略称： )
第16著者氏名（和/英/ヨミ）	/ /
第16著者所属（和/英）	(略称： ) (略称： )
第17著者氏名（和/英/ヨミ）	/ /
第17著者所属（和/英）	(略称： ) (略称： )
第18著者氏名（和/英/ヨミ）	/ /
第18著者所属（和/英）	(略称： ) (略称： )
第19著者氏名（和/英/ヨミ）	/ /
第19著者所属（和/英）	(略称： ) (略称： )
第20著者氏名（和/英/ヨミ）	/ /
第20著者所属（和/英）	(略称： ) (略称： )
講演者	第1著者
発表日時	2014-12-16 11:00:00
発表時間	90分
申込先研究会	SP
資料番号	SP2014-113
巻番号（vol）	vol.114
号番号（no）	no.365
ページ範囲	pp.69-74
ページ数	6
発行日	2014-12-08 (SP)

[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]

IEICE / 電子情報通信学会