講演名 1998/12/17
n-gramに基づく全文検索システムの分散処理 : 分散索引と自立負荷分散更新
野田 十悟, 佐藤 隆士,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 我々が研究してきたn-gramに基づいた全文検索システムは高速でノイズの少ない検索が可能であるが、索引の作成コストがかかるため大規模な文書の検索を作るっことは難しく, アクセスが集中するとレスポンスが悪くなる.そこで従来の索引構造を改良してネットワーク上に分散化できるようにした.また, リモートホストにあるデータでもそのアクセス率によりローカルにコピーしてシステムの負荷を軽減する手法について述べ, そのモデルを構築して解析を行ない, 負荷を軽減できることを示した.
抄録(英) N-gram based full text retrieval system we have previously studied can make retrieval fast and noise-less. Since the cost of making an index is expensive, it is difficult to make an index for a large amount of texts, and as the access increases the responce time is worse. Thus we improve the structure of the previous index in order to distribute the index on a network. We describe the method , in which a data on a remote host are replicated to a local host by the frequency of accesses in order to reduce the cost in that system. We made its replicated model and analyze it to show that the total cost of the system is reduced.
キーワード(和) n-gram / 全文検索 / 分散索引
キーワード(英) n-gram / full / text / retrieval / distribution / index
資料番号 DE98-33
発行日

研究会情報
研究会 DE
開催期間 1998/12/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) n-gramに基づく全文検索システムの分散処理 : 分散索引と自立負荷分散更新
サブタイトル(和)
タイトル(英) Distribution of n-gram Based Full-text Retrieval System : Distributed indecies and autonomous updation with distributed load
サブタイトル(和)
キーワード(1)(和/英) n-gram / n-gram
キーワード(2)(和/英) 全文検索 / full
キーワード(3)(和/英) 分散索引 / text
第 1 著者 氏名(和/英) 野田 十悟 / Jugo Noda
第 1 著者 所属(和/英) 大阪教育大学総合基礎科学専攻数理情報コース
Course of Mathematical and Information Science, Division of Pure and Applied Science, Graduate School of Education, Osaka Kyoiku University
第 2 著者 氏名(和/英) 佐藤 隆士 / Takashi Sato
第 2 著者 所属(和/英) 大阪教育大学情報科学
Department of Computer Science, Osaka Kyoiku University
発表年月日 1998/12/17
資料番号 DE98-33
巻番号(vol) vol.98
号番号(no) 486
ページ範囲 pp.-
ページ数 8
発行日