講演抄録/キーワード |
講演名 |
2014-12-16 13:30
音声クエリの複数認識結果を用いた音声中の検索語検出 ○大島聡史・伊藤義明(岩手県立大) SP2014-122 |
抄録 |
(和) |
国際評価型ワークショップNTCIR-11では音声で話されたクエリ(検索語)を音声ドキュメント中から検出を行うSQ-STD(Spoken Query Spoken Term Detection)に関するタスクが設定され,その評価が行われた.一つの音声クエリであっても異なる音声認識システムでは正確に認識できる場合と誤認識となる場合が想定される.また,音声クエリは既知語,未知語の判断が難しくクエリ毎に適切な認識システムを用いることは困難である.そこで本研究では複数の異なる認識単位の音声認識システムで音声クエリを認識し,それぞれの認識結果をクエリとしてSTDを行い,それらの検索結果を統合する方式を提案した.評価実験の結果,2つのシステムを統合することにより常に検索精度が向上することを確認できた.また,単体での最高精度49.05%(MAP)に比べ3つのシステムを統合すると6.56ポイント精度が向上し,提案手法の有効性を検証できた. |
(英) |
This paper describes the method about STD for SQ using MSRR. STD denotes Spoken Term Detection that is one of the most imortatnt technology to deal with multimedia data such as video data and the task for finding a query for spoken documents. SQ and MSRR denote a spoken query and multiple ASR results, respectively. The experimental results demonstrated the proposed methods worked well for open test collections of STD SQ tasks that were provided by the NTCIR organizers. |
キーワード |
(和) |
音声中の検索語検出 / 音声クエリ / 複数認識結果 / 結合 / 未知語 / / / |
(英) |
STD / SQ / MSRR / / / / / |
文献情報 |
信学技報, vol. 114, no. 365, SP2014-122, pp. 135-140, 2014年12月. |
資料番号 |
SP2014-122 |
発行日 |
2014-12-08 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2014-122 |