大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
2G
セッション名
音声言語処理
講演日
2010/09/07
講演場所(会議室等)
G会場(総合学習プラザ1F 第11講義室)
講演番号
E-013
タイトル
音声ドキュメント検索における分割したドキュメントを用いるWeb収集の効果
著者名
杉本 樹世貴西崎 博光関口 芳廣
キーワード
音声ドキュメント検索, Webページ, セグメント分割
抄録
これまでに,音声ドキュメント検索において,Webを用いたドキュメント拡張方法を提案し,その効果を示した.従来の手法では,ある1つの音声ドキュメントの音声認識結果からWeb検索に必要なクエリを抽出し,それを用いて関連するWebページを収集していた.しかし,1つの音声ドキュメント内でも,発話内容が変化していくため,全体の内容から1つのWebクエリを生成するのに無理があった.
そこで,1つのドキュメントを適当に分割し,そのセグメント毎にWebクエリを生成する手法を提案する.
これにより,Webクエリが精錬され,音声ドキュメントとより関連するWebページを収集することができる.実験の結果,分割したセグメントを用いたWeb拡張の効果が見られた.
本文pdf
PDF download (295.7KB)