講演名 2014-07-24
日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査(音声認識,認識,理解,対話,一般)
増村 亮, 浅見 太一, 大庭 隆伸, 政瀧 浩和, 阪内 澄宇,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 大語彙連続音声認識の枠組みで必要不可欠とされている言語モデルには,長らくブレークスルーがないというのが現状であろう.実用的な言語モデルとして広く利用されているn-gramモデルには,"モデル制約の局所性","モデルのタスク依存性","データスパースネス"といった問題があることは明白であるが,これらの問題を個々に解決するだけでは大幅な性能改善を得るに至っていない.この現状に対して我々は,大幅な性能改善を実現するためには,これら複数の課題を同時に解決していくことが重要なのではないかと考えている.そこで本稿では,言語モデルの課題を全体的に解決できた場合に,どの程度の性能改善を実現できるのかを明らかにするために,これまで提案されてきた様々な言語モデリング技術を併用することを試みる.我々は現状の言語モデリング技術に対して,"1パスデコーディング","教師なし適応","リスコアリング"という3つの観点を設け,観点ごと,および全体で技術併用を行った場合の性能を調査する.
抄録(英) Recent large vocabulary speech recognition systems consist of two statistical models, the acoustic and language models. In acoustic modeling, deep neural networks have realized a breakthrough and significant performance improvements have been achieved. On the other hand, in language modeling, there have not been any reports of comparable improvements. Although it is clear that recent practical language models have several problems such as "locality", "task dependency" and "data sparseness", we cannot obtain significant performance improvements by solving these problems separately. In this paper, we try to use various language modeling techniques simultaneously to cover the entire problem. Our investigation is conducted by dividing language modeling techniques into three viewpoints, "one pass decoding", "unsupervised adaptation" and "rescoring".
キーワード(和) 言語モデル / 1パスデコーディング / 教師なし適応 / リスコアリング
キーワード(英) language models / one pass decoding / unsupervised adaptation / rescoring
資料番号 SP2014-63
発行日

研究会情報
研究会 SP
開催期間 2014/7/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 日本語話し言葉音声認識における複数言語モデリング技術併用時の性能調査(音声認識,認識,理解,対話,一般)
サブタイトル(和)
タイトル(英) Investigation of Combining Multiple Language Modeling Techniques in Japanese Spontaneous Speech Recognition
サブタイトル(和)
キーワード(1)(和/英) 言語モデル / language models
キーワード(2)(和/英) 1パスデコーディング / one pass decoding
キーワード(3)(和/英) 教師なし適応 / unsupervised adaptation
キーワード(4)(和/英) リスコアリング / rescoring
第 1 著者 氏名(和/英) 増村 亮 / Ryo MASUMURA
第 1 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 2 著者 氏名(和/英) 浅見 太一 / Taichi ASAMI
第 2 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 3 著者 氏名(和/英) 大庭 隆伸 / Takanobu OBA
第 3 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 4 著者 氏名(和/英) 政瀧 浩和 / Hirokazu MASATAKI
第 4 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 5 著者 氏名(和/英) 阪内 澄宇 / Sumitaka SAKAUCHI
第 5 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
発表年月日 2014-07-24
資料番号 SP2014-63
巻番号(vol) vol.114
号番号(no) 151
ページ範囲 pp.-
ページ数 6
発行日