講演抄録/キーワード |
講演名 |
2007-07-02 14:55
ハイブリッド型文書検索システムの試作と性能評価 ○牛嶋一智・今一 修・安田知弘・岩山 真(日立) DE2007-31 |
抄録 |
(和) |
企業内に蓄積された大量業務情報の有効活用を目的として,大規模高度検索技術へのニーズが高まっている.検索処理の大規模化および高度化に対しては,高速な絞込み検索が得意なインデクス型検索と高度な検索が得意なスキャン型検索を組合せたハイブリッド型のアプローチが有効である.本稿では,ハイブリッド型検索の実応用での性能特性確認のため,ハイブリッド型を採用した文書検索プロトタイプを開発し,両検索方式の性能特性に応じて適切な処理分担を行う検索式変換法の検討を行った.その結果,実検索履歴に基づく特許検索ベンチマークにおいて,ハイブリッド型検索の有効性を確認するとともに,性能特性に応じた検索式変換により最悪検索時間を3割強,平均検索時間を2割強さらに削減できる見通しを得た. |
(英) |
Large-scale advanced search techniques are getting important to realize efficient utilization of growing enterprise data. In general, index-type search methods are suitable for large-scale search and scan-type search methods are suitable for advanced search. Combining these types of the search methods, we can construct hybrid-type search methods effective for both types of search. In this article, we describe a prototype system which presents a practical performance profile of a hybrid-type text search method and also propose a search formula translation technique which modifies the assignment of search processing between the search methods according to their performance profiles. As a result, we confirmed the effectiveness of the hybrid-type search method and also confirmed an over 30 percent reduction in the worst search time and an over 20 percent reduction in the average search time using the search formula translation technique. |
キーワード |
(和) |
ハイブリッド検索 / インデクス検索 / スキャン検索 / 検索式変換 / 文書検索 / / / |
(英) |
Hybrid Search / Index Search / Scan Search / Search Formula Translation / Document Retrieval / / / |
文献情報 |
信学技報, vol. 107, no. 131, DE2007-31, pp. 55-60, 2007年7月. |
資料番号 |
DE2007-31 |
発行日 |
2007-06-25 (DE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2007-31 |
|