講演名 | 2013/12/12 分布間距離ベクトルに基づく音響的類似度とサブワード事後確率の併用による音声検索語検出の改善(音声認識,第15回音声言語シンポジウム) 山本 直樹, 甲斐 充彦, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 近年,音声や動画などのマルチメディアコンテンツの配信や利用が拡大しており,高い精度のマルチメディア検索技術が望まれている.音声ドキュメント検索に関しては,与えられた検索語が発話されている箇所を音声ドキュメント中から特定する音声検索語検出(Spoken TermDetection:STD)の研究が盛んに行われている.最も基本的なアプローチとして,音声認識結果を元にサブワード(音素や音節)列としてインデキシングを行い,誤認識や未知語の問題に対処するためサブワード単位の誤りを許容して検索語との類似性を評価する方法が用いられることが多い.以前に我々はサブワード単位音響モデルの分布間距離ベクトルという構造的特徴表現に基づく音響的類似度を検索語検出スコアの評価のために用いることを提案し,検索性能を改善した.本研究では更に大語彙音声認識やサブワードレベルの連続音声認識での信頼度情報を反映して検出スコアを推定し,従来の方法と併用する方法を提案する.評価実験の結果,評価用データとして用いたNTCIR10のSDPWSのデータセットでリファレンスの認識結果のみを用いた結果として,NTCIR10 SpokenDoc2 formal-runでの他の方法の結果よりも高い検出精度を得た. |
抄録(英) | |
キーワード(和) | |
キーワード(英) | |
資料番号 | Vol.2013-SLP-99 No.1 |
発行日 |
研究会情報 | |
研究会 | SP |
---|---|
開催期間 | 2013/12/12(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Speech (SP) |
---|---|
本文の言語 | JPN |
タイトル(和) | 分布間距離ベクトルに基づく音響的類似度とサブワード事後確率の併用による音声検索語検出の改善(音声認識,第15回音声言語シンポジウム) |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | |
第 1 著者 氏名(和/英) | 山本 直樹 |
第 1 著者 所属(和/英) | 静岡大学大学院・工学研究科 Graduate School of Engineering, Shizuoka University |
第 2 著者 氏名(和/英) | 甲斐 充彦 |
第 2 著者 所属(和/英) | 静岡大学大学院・工学研究科 Graduate School of Engineering, Shizuoka University |
発表年月日 | 2013/12/12 |
資料番号 | Vol.2013-SLP-99 No.1 |
巻番号(vol) | vol.113 |
号番号(no) | 366 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |