大会名称 |
---|
2010年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2010 |
発行日 |
2010/8/20 |
セッション番号 |
6R |
セッション名 |
情報抽出と情報検索 |
講演日 |
2010/09/09 |
講演場所(会議室等) |
R会場(ウエスト2号館3F 第6講義室) |
講演番号 |
D-035 |
タイトル |
クエリログから抽出した関連語集合を用いたウェブページ検索 |
著者名 |
藤田 尚樹, 高橋 大和, 宮原 伸二, 片渕 典史, 片岡 良治, |
キーワード |
検索精度向上, 関連語, クエリログ, BM25 |
抄録 |
キーワードを用いたウェブページ検索では,キーワードのページ内頻度(tf)は重要な情報源であり,ページとキーワードの適合度を計算する際に利用される.しかし,tfが大きいページが必ず検索者の求めるページとは限らない.本論文では検索エンジンのクエリログを用いて,クエリ中でキーワードと共起している語をキーワードの関連語として抽出し,ページとキーワードの適合度をキーワードのtfに関連語のtfを任意の割合で加えた重み付tfを用いてBM25で計算する適合度計算手法を提案している.評価実験では,商用検索エンジンのクエリログを用いて提案手法による検索を実施し,提案手法が検索精度向上に効果がある事を確認している. |
本文pdf |
PDF download (484.4KB) |