講演名 2007-06-29
複数の雑音合成モデルを用いた探索に基づく雑音抑圧手法(認識,理解,対話,一般)
實廣 貴敏, 鳥山 朋二, 小暮 潔,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 実環境下での音声認識では,認識対象の音声,異なる種類の周囲雑音,および,それらが重なり合ったものが入力される.雑音抑圧の従来法では一つの雑音源と仮定することが多く,複数種類の雑音が存在する場合には対応が困難であった.こういった実環境下での雑音に対応するため,本研究では,複数種類の雑音モデルおよびその合成モデルを用いた雑音抑圧手法を提案する.具体的には,複数の雑音それぞれをモデル化し,それらの合成モデルを用意する.さらに,そのモデルラベル系列から得られるN-gramモデルと辞書とを用い,一般的な音声認識と同様なマルチパス・ビーム探索を行う.合成モデルにより,雑音重畳部分の検出が可能である.探索結果として得られた最尤ラベル系列に対応する雑音重畳モデルをフレームごとに選択し,複数雑音合成モデルに拡張した,Gaussian Mixture Model(GMM)に基づく雑音抑圧手法により,雑音抑圧を行う.E-Nightingaleプロジェクトにおいて,実際の病院にて収録された音声を評価に用いた.提案法は,従来法に比べ,より効果的であることが分かった.
抄録(英) We introduce a new noise suppression method by using a search strategy with multi-model compositions that includes the models of speech, noises, and their composites. Before noise suppression, a multi-pass and beam search is performed to find the best sequences of these models using noise acoustic models, noise-label n-gram models, and a noise-label lexicon. Noise suppression is frame-synchronously performed by the multiple models selected by the search. We evaluated this method using the E-Nightingale task, which contains voice memoranda spoken by nurses during actual work at hospitals. The proposed method obtained higher perfomance than that of the conventional method.
キーワード(和) 音声認識 / 雑音抑圧 / モデル合成 / マルチパスサーチ / E-Nightingaleプロジェクト
キーワード(英) speech recognition / noise suppression / model composition / multi-pass search / E-Nightingale project
資料番号 SP2007-16
発行日

研究会情報
研究会 SP
開催期間 2007/6/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 複数の雑音合成モデルを用いた探索に基づく雑音抑圧手法(認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Noise Suppression Using Search with Multi-Noise Composite Models
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / speech recognition
キーワード(2)(和/英) 雑音抑圧 / noise suppression
キーワード(3)(和/英) モデル合成 / model composition
キーワード(4)(和/英) マルチパスサーチ / multi-pass search
キーワード(5)(和/英) E-Nightingaleプロジェクト / E-Nightingale project
第 1 著者 氏名(和/英) 實廣 貴敏 / Takatoshi JITSUHIRO
第 1 著者 所属(和/英) ATR知識科学研究所
ATR Knowledge Science Laboratories
第 2 著者 氏名(和/英) 鳥山 朋二 / Tomoji TORIYAMA
第 2 著者 所属(和/英) ATR知識科学研究所
ATR Knowledge Science Laboratories
第 3 著者 氏名(和/英) 小暮 潔 / Kiyoshi KOGURE
第 3 著者 所属(和/英) ATR知識科学研究所
ATR Knowledge Science Laboratories
発表年月日 2007-06-29
資料番号 SP2007-16
巻番号(vol) vol.107
号番号(no) 116
ページ範囲 pp.-
ページ数 6
発行日