講演名 1997/7/15
高速テキスト検索のためのパトリシアトライ構造化シグネチャファイル
権藤 夏男, 金子 邦彦, 牧之内 顕文,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 指定されたキーワードを含むようなテキストの検索(全文検索)のためのインデックスは, 現在でも重要な研究テーマである. 全文検索用インデックスの一種であるシグネチャファイルのサイズ及び全文検索処理コストは, 後処理であるフォルスドロップ(false drop)の処理コストを無視すると, 検索対象のテキスト数に比例する. シグネチャファイルをビットデータ用探索木の一種であるパトリシアトライ(Patricia Trie)と組み合わせると, 我々の実験では, そのサイズは本来のシグネチャファイルとおおよそ同じであり, その全文検索処理コストは, 検索対象のテキスト数でなく, 検索結果として得られるテキスト数と相関があることが分かった. その結果, 多数のテキストを絞り込んで少数のテキストを得るような場合に有効であるとの結論を得た.
抄録(英) Full-text search is important research issue. Full-text search is to search the documents that contain the specified keyword(s). Signature file is one of the effective indexes for full-text search. The size of signature file and the retrieval cost using signature file increase in proportion to the number of documents in a database. In this paper, we propose a Patricia trie structured signature file. From our experiment, the number of retrieved documents and the retrieval cost using the Patricia trie structured signature file correlates. We conclude that our index is practical when the size of database is large, and the number of retrieved documents is relatively small.
キーワード(和) 全文検索 / インデックス / シグネチャファイル / トライ / テキストデータ
キーワード(英) full-text search / index / signature file / trie / text database
資料番号 DE97-37
発行日

研究会情報
研究会 DE
開催期間 1997/7/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 高速テキスト検索のためのパトリシアトライ構造化シグネチャファイル
サブタイトル(和)
タイトル(英) Patricia Trie Structured Signature File for Full Text Search
サブタイトル(和)
キーワード(1)(和/英) 全文検索 / full-text search
キーワード(2)(和/英) インデックス / index
キーワード(3)(和/英) シグネチャファイル / signature file
キーワード(4)(和/英) トライ / trie
キーワード(5)(和/英) テキストデータ / text database
第 1 著者 氏名(和/英) 権藤 夏男 / Natsuo GONDO
第 1 著者 所属(和/英) 九州大学大学院システム情報科学研究科
Graduate School of Information Science and Electrical Engineering, Kyushu University
第 2 著者 氏名(和/英) 金子 邦彦 / Kunihiko KANEKO
第 2 著者 所属(和/英) 九州大学大学院システム情報科学研究科
Graduate School of Information Science and Electrical Engineering, Kyushu University
第 3 著者 氏名(和/英) 牧之内 顕文 / Akifumi MAKINOUCHI
第 3 著者 所属(和/英) 九州大学大学院システム情報科学研究科
Graduate School of Information Science and Electrical Engineering, Kyushu University
発表年月日 1997/7/15
資料番号 DE97-37
巻番号(vol) vol.97
号番号(no) 161
ページ範囲 pp.-
ページ数 6
発行日