講演名 2009-07-17
話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
伊藤 貴, 奥山 洋平, 加藤 正治, 小坂 哲夫, 好田 正紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では講演音声認識の性能向上を目指し,話者クラス音響モデルの検討を行った.話者クラスモデルの使用法として,1)尤度基準によるモデルの自動選択,2)システム統合,の検討を行った.さらに,この認識結果を利用して教師なし適応の性能向上の検討を行った.以上の評価を日本語話し言葉コーパスを用いて行った.認識実験の結果,ベースラインの単語誤り率19.75%に対し,話者クラスモデルの自動選択で19.11%,システム統合で18.65%を得た.また,一般的なMLLR適応で17.50%,話者クラス音響モデルを利用した適応で17.03%,適応後の話者クラス音響モデルの出力統合により16.79%を得た.以上より,講演音声認識において,提案手法が有効であることが分かった.
抄録(英) This paper describes a new method based on speaker-class (SC) models in order to improve the performance of lecture speech recognition. We investigate two usages of SC models: 1) the automatic selection of SC model by likelihood basis, and 2) the system combination of SC models. Furthermore, unsupervised speaker adaptation is studied by using SC models. The evaluation was conducted on CSJ (Corpus of Spontaneous Japanese). As the results, a word error rate of 19.11% was obtained by using the automatic selection method, and 18.65% was obtained by using the system combination, while 19.75% was obtained in the baseline experiment. In addition, 17.03% was obtained by using the adaptation method based on SC models, and 16.79% was obtained by using the system combination based on adapted SC models, while 17.50% was obtained by using conventional MLLR. The results showed that the proposed methods were effective for lecture speech recognition.
キーワード(和) 大語彙連続音声認識 / 教師なし話者適応 / 話者クラスモデル / システム統合 / 日本語話し言葉コーパス / HMM
キーワード(英) LVCSR / unsupervised speaker adaptation / speaker-class model / system combination / Corpus of Spontaneous Japanese / HMM
資料番号 SP2009-42
発行日

研究会情報
研究会 SP
開催期間 2009/7/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 話者クラス音響モデルを用いた講演音声認識の性能向上(音響モデル,認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Improvement of lecture speech recognition by using speaker-class models
サブタイトル(和)
キーワード(1)(和/英) 大語彙連続音声認識 / LVCSR
キーワード(2)(和/英) 教師なし話者適応 / unsupervised speaker adaptation
キーワード(3)(和/英) 話者クラスモデル / speaker-class model
キーワード(4)(和/英) システム統合 / system combination
キーワード(5)(和/英) 日本語話し言葉コーパス / Corpus of Spontaneous Japanese
キーワード(6)(和/英) HMM / HMM
第 1 著者 氏名(和/英) 伊藤 貴 / Takashi ITO
第 1 著者 所属(和/英) 山形大学大学院理工学研究科
Graduate School of Science and Engineering, Yamagata University
第 2 著者 氏名(和/英) 奥山 洋平 / Yohei OKUYAMA
第 2 著者 所属(和/英) (現)富士通(株)
/ Graduate School of Science and Engineering, Yamagata University
第 3 著者 氏名(和/英) 加藤 正治 / Masaharu KATO
第 3 著者 所属(和/英) 山形大学大学院理工学研究科
Graduate School of Science and Engineering, Yamagata University /
第 4 著者 氏名(和/英) 小坂 哲夫 / Tetsuo KOSAKA
第 4 著者 所属(和/英) 山形大学大学院理工学研究科
第 5 著者 氏名(和/英) 好田 正紀 / Masaki KOHDA
第 5 著者 所属(和/英) 山形大学
発表年月日 2009-07-17
資料番号 SP2009-42
巻番号(vol) vol.109
号番号(no) 139
ページ範囲 pp.-
ページ数 6
発行日