講演名 2004/1/19
概念類似性判別を用いた情報検索システムの高速化方式の提案(ドキュメント管理とセマンティックWeb)(<特集テーマ>ディジタルエンタープライズ,及び一般)
橋口 公平, 湯川 高志,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 概念ベースを用いた情報検索システムに対し、ベクトル空間の分割により検索候補を限定する高速化方式を提案する.本システムではベクトル空間モデルを用いている.ベクトル空間モデルのインデキシング法としてSR-Treeが提案されている.しかし、SR-Treeでは、高次元では原理的に空間分離が困難となり本システムが対象とする100次元以上のデータには対応できない.そこで、本システムのベクトル空間におけるデータ分布の局所性に着目し、ベクトル空間の分割によって次元を減らすことで、SR-Treeにより検索候補を絞り、それに対し高次元での線形探索を行う高速化方式を提案した.日本語情報検索テキストコレクションNTCIR-1のデータを用いた評価により約2倍の速度向上を確認した.ベクトル空間の分割を行うため適合損失が生じるが、最適な次元分割の選択により、その損失率を平均で5%以下に抑えることができる.
抄録(英) A high speed information retrieval method that restricts result candidates with division of the vector space for concent-based information retrieval(CBIR) is proposed. CBIR employs the vector space model. SR-Tree has been proposed as indexing for the vector space model. However, SR-Tree can't cope with the data of 100 dimensions and more which this system employs, because space separation becomes difficult in the high dimensional vector space. Thus, we pays attention to the locality of the data distribution in the vector space of CBIR and we proposed the method that divides the vector space, limits result candidates by SR-Tree, and obtains results with linear search from the candidates. We confirmed the speed improvement of about 2 times. Result loss rate with division of the vector space was less than 5%.
キーワード(和) 概念ベース / ベクトル空間モデル / SR-Tree / ベクトル空間の分割
キーワード(英) concept-base / vector space model / SR-Tree / division of the vector space
資料番号 KBSE2003-34
発行日

研究会情報
研究会 KBSE
開催期間 2004/1/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 概念類似性判別を用いた情報検索システムの高速化方式の提案(ドキュメント管理とセマンティックWeb)(<特集テーマ>ディジタルエンタープライズ,及び一般)
サブタイトル(和)
タイトル(英) Speed-up of the information retrieval system using the concept-base.
サブタイトル(和)
キーワード(1)(和/英) 概念ベース / concept-base
キーワード(2)(和/英) ベクトル空間モデル / vector space model
キーワード(3)(和/英) SR-Tree / SR-Tree
キーワード(4)(和/英) ベクトル空間の分割 / division of the vector space
第 1 著者 氏名(和/英) 橋口 公平 / Kohei HASHIGUCHI
第 1 著者 所属(和/英) 長岡技術科学大学
Nagaoka University of Technology
第 2 著者 氏名(和/英) 湯川 高志 / Takashi YUKAWA
第 2 著者 所属(和/英) 長岡技術科学大学
Nagaoka University of Technology
発表年月日 2004/1/19
資料番号 KBSE2003-34
巻番号(vol) vol.103
号番号(no) 603
ページ範囲 pp.-
ページ数 5
発行日