講演名 2012-12-20
文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)
山畠 祥子, 山口 義和, 小川 厚徳, 政瀧 浩和, 吉岡 理, 高橋 敏,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声認識において,認識辞書にない単語(未知語)が発話されると誤認識を起こすという未知語問題は,重要な課題の一つである.特に音声認識の応用分野拡大に伴い,専門用語などが多く話されるようになり,対象音声データに必要な未知語を自動で登録する技術の重要性が高まっている.しかし,あらゆる未知語を認識辞書に登録すれば,対象音声データで発話されない単語が湧き出し誤りの原因となってしまう.特に話し言葉音声認識においては,冗長な単語エントリによる誤認識の影響が大きくなる.本稿では,認識辞書にない未知語を関連文書から自動抽出して登録する場合において,対象音声データで発話される未知語のみを選出することで,登録した単語による湧き出し誤りを抑えて高精度に認識する手法を提案する.未知語選出には,未知語と対象音声データの文脈的な適合度を表す文脈類似度と,音響的な適合度を表す認識信頼度を用いる.そして,両者の特徴量を融合し,必要な未知語を効果的に選出する.また,クラス言語モデルの枠組みと文脈類似度を利用し,登録する未知語に対して効果的に確率推定を行う.我々は電話会話音声を用いて,未知語選出精度,及び未知語認識精度の評価を行った.その結果,未知語選出精度を従来手法に比べて大きく改善することができ,また未知語認識精度をF値で約5%改善した.
抄録(英) Out-Of-Vocabulary utterances are an unavoidable problem in speech recognition systems. And therefore, automatic vocabulary adaptation methods, which detect OOV words from relevant documents and register them with proper probability is an important technique. To improve recognition accuracy of OOV words, our method selects only relevant OOV words with target spoken documents, and prevents recognition error caused by irrelevant OOV words. We use semantic and acoustic similarity between each OOV word and spoken documents to select relevant OOV words. Furthermore, we propose proper probability estimation method for each OOV word using class language models and semantic similarity. Experimental shows that our method improves OOV word selection accuracy, and OOV word recognition accuracy about 5% in F-measure.
キーワード(和) 音声認識 / 未知語 / 言語モデル / 語彙適応 / 文脈類似度 / 認識信頼度
キーワード(英) Speech Recognition / Out-Of-Vocabulary / Vocabulary Adaptation / Semantic Similarity / Confidence Measure
資料番号 SP2012-85
発行日

研究会情報
研究会 SP
開催期間 2012/12/13(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Speech (SP)
本文の言語 JPN
タイトル(和) 文脈類似度と認識信頼度に基づく音声認識辞書の自動語彙適応(言語モデル・音声対話)
サブタイトル(和)
タイトル(英) Automatic Vocabulary Adaptation for Speech Recognition based on Semantic Similarity and Confidence Measure
サブタイトル(和)
キーワード(1)(和/英) 音声認識 / Speech Recognition
キーワード(2)(和/英) 未知語 / Out-Of-Vocabulary
キーワード(3)(和/英) 言語モデル / Vocabulary Adaptation
キーワード(4)(和/英) 語彙適応 / Semantic Similarity
キーワード(5)(和/英) 文脈類似度 / Confidence Measure
キーワード(6)(和/英) 認識信頼度
第 1 著者 氏名(和/英) 山畠 祥子 / Shoko Yamahata
第 1 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 2 著者 氏名(和/英) 山口 義和 / Yoshikazu Yamaguchi
第 2 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 3 著者 氏名(和/英) 小川 厚徳 / Atsunori Ogawa
第 3 著者 所属(和/英) 日本電信電話株式会社NTTコミュニケーション科学基礎研究所
NTT Media Communication Science Laboratiories
第 4 著者 氏名(和/英) 政瀧 浩和 / Hirokazu Masataki
第 4 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 5 著者 氏名(和/英) 吉岡 理 / Osamu Yoshioka
第 5 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
第 6 著者 氏名(和/英) 高橋 敏 / Satoshi Takahashi
第 6 著者 所属(和/英) 日本電信電話株式会社NTTメディアインテリジェンス研究所
NTT Media Intelligence Laboratories
発表年月日 2012-12-20
資料番号 SP2012-85
巻番号(vol) vol.112
号番号(no) 369
ページ範囲 pp.-
ページ数 6
発行日