講演抄録/キーワード |
講演名 |
2007-06-29 13:00
講演音声認識における教師なし適応の改善 ○草間 隆・奥山洋平・加藤正治・小坂哲夫・好田正紀(山形大) SP2007-20 |
抄録 |
(和) |
近年,自然発話に近い大規模な音声データベースを用いて,大語彙連続音声認識が研究されている.本論文では,2004年6月に公開された「『日本語話し言葉コーパス : CSJ』最終公開版」を用いて,教師なし適応の改善を検討した.対角共分散音響モデルと全共分散音響モデルを作成し,音響・言語モデルの繰り返し教師なし適応を検討した.さらに,認識結果に含まれる品詞情報に基づいて適応データの選択や重み付けを検討した.公開版CSJのtestset1により評価した結果,全共分散音響モデルを用いる場合の単語誤り率は適応前19.17%,繰り返し適応後14.73%,さらに適応データ重み付けにより14.55%を達成した. |
(英) |
In recent years, many aggressive approaches for large vocabulary continuous speech recognition (LVCSR) system trained on large-scale spontaneous speech database have been investigated. In this paper, we present and compare several methods of unsupervised adaptation for LVCSR and evaluate the methods using diagonal-covariance and full-covariance models on the Corpus of Spontaneous Japanese. The results of recognition experiments with full-covariance model showed the decrease in word error rate from 19.17% without adaptation to 14.73% with unsupervised adaptation, moreover to 14.55% with unsupervised adaptation by weighting the adaptation data on the basis of a part of speech. |
キーワード |
(和) |
大語彙連続音声認識 / 講演音声認識 / 教師なし適応 / 全共分散モデル / 日本語話し言葉コーパス / / / |
(英) |
LVCSR / lecture speech recognition / unsupervised adaptation / full-covariance model / Corpus of Spontaneous Japanese / / / |
文献情報 |
信学技報, vol. 107, no. 116, SP2007-20, pp. 73-78, 2007年6月. |
資料番号 |
SP2007-20 |
発行日 |
2007-06-21 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2007-20 |
|