講演抄録/キーワード |
講演名 |
2012-02-10 17:00
音声ドキュメント検索におけるクエリ拡張と音節認識の併用の効果 ○大橋宏正(名大)・柘植 覚(大同大)・北岡教英・武田一哉(名大)・北 研二(徳島大) PRMU2011-239 SP2011-154 |
抄録 |
(和) |
本稿ではクエリ拡張と音節認識を併用した音声ドキュメント検索手法を提案する.
提案法では検索エンジンを用いてWebから収集したウェブページに含まれる単語によってクエリの拡張を行う.
クエリベクトルと拡張ベクトルにより張られる平面でクエリに関連する音声ドキュメント集合をモデル化し,
音声ドキュメントのベクトルとその平面との距離によりドキュメントを評価する.
更に,検索対象となる音声ドキュメントは連続単語音声認識の結果から構築されるベクトル空間だけでなく,
連続音節音声認識の結果から構築されるベクトル空間上においても表現される.
各々の空間におけるクエリと音声ドキュメント間のコサイン距離を線形補間し,
クエリ拡張と併用することによりMAP値がベースライン性能である0.393と比較して0.406に改善する結果を得た. |
(英) |
In this paper, we propose a spoken document retrieval method which combines query expansion with continuous syllable recognition.
The proposed method expands a query by using words from the web pages collected by a search engine.
It is assumed that relevant document vectors exist on the plane which is constructed from the query vector and the extended vector.
The weight parameter between a target document vector and a query vector is calculated for query expansion.
In addition, target documents are mapped not only to space constructed by continuous word speech recognition results,
but also to space constructed by syllable speech recognition results.
Then, we conducted spoken document retrieval experiments.
The experimental results showed that the proposed method improved the mean average precision source from the baseline 0.393 to 0.406. |
キーワード |
(和) |
音声ドキュメント検索 / ベクトル空間モデル / クエリ拡張 / 音節認識 / / / / |
(英) |
Spoken Document Retrieval / Vector Space Model / Query Expansion / Continuous Syllable Recognition / / / / |
文献情報 |
信学技報, vol. 111, no. 431, SP2011-154, pp. 249-254, 2012年2月. |
資料番号 |
SP2011-154 |
発行日 |
2012-02-02 (PRMU, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2011-239 SP2011-154 |