大会名称
2010年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2010
発行日
2010/8/20
セッション番号
6G
セッション名
情報抽出・検索
講演日
2010/09/09
講演場所(会議室等)
G会場(総合学習プラザ1F 第11講義室)
講演番号
E-038
タイトル
文書構造を考慮した近接度スコアを用いた文書検索結果ランキング方式
著者名
鈴木 克典湯川 高志戸田 浩之数原 良彦片岡 良治
キーワード
情報検索, テキスト処理, 近接性, 文書構造
抄録
テキスト検索分野において従来提案されている近接性評価は、キーワード同士の形態素数のみを考慮するのが一般的であった.
本稿ではWeb文書が構造を有する事に着目し,より有意味な近接性評価を提案するものである.特に著者らは,タイトルとその本文の構造に着目し,その物理的距離を意味的距離に近づける事で検索精度の向上を目指す.
またクエリの近接性について,上記の構造を考慮した近接度スコアの与え方に加え,その近接度スコアと既存のキーワード関連度との組み合わせ方について新たな提案を行う.
この提案法について,Web文書のうちTRECから適合性判定データが付与されているデータに対して実験を行い,その結果適合率が向上することを確認した.
本文pdf
PDF download (446KB)