講演抄録/キーワード |
講演名 |
2010-07-23 13:50
単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定 ○浅見太一・小橋川 哲・山口義和・政瀧浩和・高橋 敏(NTT) SP2010-42 |
抄録 |
(和) |
本稿では,音声ドキュメントに対して音声認識信頼度を付与する方法を提案し,性能評価実験の結果を報告する.音声ドキュメントデータベースからの情報抽出アプリケーションの実用性向上のためには,「精度の低い音声ドキュメント認識結果をいかに棄却するか」という問題の解決が重要だと考えている.提案法では,単語/発話よりも広範囲の音声認識結果を見渡して得られる単語の文脈一貫性と,入力音声と音声認識結果の一致度合いを表す音響尤度を用いて音声ドキュメント認識信頼度を算出する.電話会話音声に対して提案法によって信頼度を算出し,閾値により音声ドキュメント単位での棄却を行うことで,受理された音声ドキュメントの平均文字正解率が79.56% から84.18% に向上,標準偏差が7.51 から4.51 に減少し,提案法により精度の高い音声ドキュメント認識結果を選択的に抽出できることを確認した. |
(英) |
This paper presents a confidence estimation method for spoken document verification. Rejection of spoken documents with poor transcripts is an important issue for the information retrieval applications utilizing spoken document database. The proposed confidence estimation method uses acoustic likelihood and word contextual coherence obtained from longer range of recognition result than word or utterance. We evaluated spoken document rejection performance on phone call speech. The results show that our spoken document confidence score can selectively extract well recognized transcripts of spoken documents. By the spoken document rejection, the mean of character correctness of accepted documents was improved from 79.56% to 84.18%, and the standard deviation was reduced from 7.51 to 4.51. |
キーワード |
(和) |
音声認識 / 信頼度 / 音声ドキュメント / 文脈一貫性 / 音響尤度 / / / |
(英) |
Speech recognition / confidence measure / spoken document / contextual coherence / acoustic likelihood / / / |
文献情報 |
信学技報, vol. 110, no. 143, SP2010-42, pp. 43-48, 2010年7月. |
資料番号 |
SP2010-42 |
発行日 |
2010-07-15 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2010-42 |
研究会情報 |
研究会 |
SP |
開催期間 |
2010-07-22 - 2010-07-24 |
開催地(和) |
仙台 秋保温泉 緑水亭 |
開催地(英) |
Ryokusui-tei (Sendai) |
テーマ(和) |
認識,理解,対話,一般(SLPと合同(併催)) |
テーマ(英) |
Recognition, Understanding, Dialogue, etc.(Prallelized with SIG-SLP) |
講演論文情報の詳細 |
申込み研究会 |
SP |
会議コード |
2010-07-SP |
本文の言語 |
日本語 |
タイトル(和) |
単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度の推定 |
サブタイトル(和) |
|
タイトル(英) |
Confidence Estimation at the Spoken Document Level Using Word Contextual Coherence and Acoustic Likelihood |
サブタイトル(英) |
|
キーワード(1)(和/英) |
音声認識 / Speech recognition |
キーワード(2)(和/英) |
信頼度 / confidence measure |
キーワード(3)(和/英) |
音声ドキュメント / spoken document |
キーワード(4)(和/英) |
文脈一貫性 / contextual coherence |
キーワード(5)(和/英) |
音響尤度 / acoustic likelihood |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
浅見 太一 / Taichi Asami / アサミ タイチ |
第1著者 所属(和/英) |
日本電信電話株式会社,NTTサイバースペース研究所 (略称: NTT)
NTT Cyber Space Laboratories, NTT Corporation (略称: NTT Corp.) |
第2著者 氏名(和/英/ヨミ) |
小橋川 哲 / Satoshi Kobashikawa / コバシカワ サトシ |
第2著者 所属(和/英) |
日本電信電話株式会社,NTTサイバースペース研究所 (略称: NTT)
NTT Cyber Space Laboratories, NTT Corporation (略称: NTT Corp.) |
第3著者 氏名(和/英/ヨミ) |
山口 義和 / Yoshikazu Yamaguchi / ヤマグチ ヨシカズ |
第3著者 所属(和/英) |
日本電信電話株式会社,NTTサイバースペース研究所 (略称: NTT)
NTT Cyber Space Laboratories, NTT Corporation (略称: NTT Corp.) |
第4著者 氏名(和/英/ヨミ) |
政瀧 浩和 / Hirokazu Masataki / マサタキ ヒロカズ |
第4著者 所属(和/英) |
日本電信電話株式会社,NTTサイバースペース研究所 (略称: NTT)
NTT Cyber Space Laboratories, NTT Corporation (略称: NTT Corp.) |
第5著者 氏名(和/英/ヨミ) |
高橋 敏 / Satoshi Takahashi / タカハシ サトシ |
第5著者 所属(和/英) |
日本電信電話株式会社,NTTサイバースペース研究所 (略称: NTT)
NTT Cyber Space Laboratories, NTT Corporation (略称: NTT Corp.) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2010-07-23 13:50:00 |
発表時間 |
25分 |
申込先研究会 |
SP |
資料番号 |
SP2010-42 |
巻番号(vol) |
vol.110 |
号番号(no) |
no.143 |
ページ範囲 |
pp.43-48 |
ページ数 |
6 |
発行日 |
2010-07-15 (SP) |
|