講演名 2009-07-01
RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
大貫 和永, 高橋 亘, 吉澤 真吾, 宮永 喜一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では,連続音声認識向きの雑音ロバスト音響モデルについての説明とそのモデルが実現する音素認識の雑音ロバスト性に関する考察を行う。音響モデルの構築には,観測雑音や環境雑音を含む学習データより,それらの雑音を抑制するRSA手法を導入し,高精度で雑音の影響の少ないHMM音響モデルを実現する。これにより,従来の音響モデル間で実現してる音素間距離に比べ,より大きい音素間距離が得られ,結果として,雑音に強い連続音声認識が実現できる。
抄録(英) In this report, the design of noise robust acoustic models is explained and its noise robustness based on these models is explored. The acoustic models are trained with noisy speech data under ordinary circumstances and thus its precision degrades considerably. In order to reduce such noise influence, a running spectrum analysis (RSA) is introduced. The acoustic models with RSA can realize distinct discrimination between two different phonemes where an conventional acoustic models cannot realize clear distance between them. From these results, noise robust continuous speech recognition can be developed.
キーワード(和) RSA / 雑音ロバスト音声認識 / 変調スペクトル / 音響モデル
キーワード(英) RSA / Robust speech recognition / Modulation spectrum / Acoustic Modeling
資料番号 CAS2009-8,VLD2009-13,SIP2009-25
発行日

研究会情報
研究会 VLD
開催期間 2009/6/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 VLSI Design Technologies (VLD)
本文の言語 JPN
タイトル(和) RSA音響モデルのロバスト性と音素間距離の検討(信号処理,LSI及び一般)
サブタイトル(和)
タイトル(英) Analysis for robustness of RSA acoustic model by distance between phonemes
サブタイトル(和)
キーワード(1)(和/英) RSA / RSA
キーワード(2)(和/英) 雑音ロバスト音声認識 / Robust speech recognition
キーワード(3)(和/英) 変調スペクトル / Modulation spectrum
キーワード(4)(和/英) 音響モデル / Acoustic Modeling
第 1 著者 氏名(和/英) 大貫 和永 / Kazunaga OHNUKI
第 1 著者 所属(和/英) 釧路工業高等専門学校
Kushiro National College of Technology
第 2 著者 氏名(和/英) 高橋 亘 / Wataru TAKAHASHI
第 2 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Sicience and Technology, Hokkaido University
第 3 著者 氏名(和/英) 吉澤 真吾 / Shingo YOSHIZAWA
第 3 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Sicience and Technology, Hokkaido University
第 4 著者 氏名(和/英) 宮永 喜一 / Yoshikazu MIYANAGA
第 4 著者 所属(和/英) 北海道大学大学院情報科学研究科
Graduate School of Information Sicience and Technology, Hokkaido University
発表年月日 2009-07-01
資料番号 CAS2009-8,VLD2009-13,SIP2009-25
巻番号(vol) vol.109
号番号(no) 111
ページ範囲 pp.-
ページ数 6
発行日