大会名称 |
---|
2010年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2010 |
発行日 |
2010/8/20 |
セッション番号 |
2G |
セッション名 |
音声言語処理 |
講演日 |
2010/09/07 |
講演場所(会議室等) |
G会場(総合学習プラザ1F 第11講義室) |
講演番号 |
E-013 |
タイトル |
音声ドキュメント検索における分割したドキュメントを用いるWeb収集の効果 |
著者名 |
杉本 樹世貴, 西崎 博光, 関口 芳廣, |
キーワード |
音声ドキュメント検索, Webページ, セグメント分割 |
抄録 |
これまでに,音声ドキュメント検索において,Webを用いたドキュメント拡張方法を提案し,その効果を示した.従来の手法では,ある1つの音声ドキュメントの音声認識結果からWeb検索に必要なクエリを抽出し,それを用いて関連するWebページを収集していた.しかし,1つの音声ドキュメント内でも,発話内容が変化していくため,全体の内容から1つのWebクエリを生成するのに無理があった. そこで,1つのドキュメントを適当に分割し,そのセグメント毎にWebクエリを生成する手法を提案する. これにより,Webクエリが精錬され,音声ドキュメントとより関連するWebページを収集することができる.実験の結果,分割したセグメントを用いたWeb拡張の効果が見られた. |
本文pdf |
PDF download (295.7KB) |