講演名 2006-11-10
極大系列抽出を目的とする系列包含検査の高速化アルゴリズム(「さまざまな分野の形式的検証最前線」及びAI一般)
市川 博規, 岩沼 宏治, 鍋島 英知,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,大規模な単一データベース系列中に出現する極大頻出系列を抽出することを目的として,系列の包摂検査および頻度計算に関する高速アルゴリズムについて考察する.高速化のためにAgrawalらによって提案されたハッシュ木や新しく出現インデックスを考察して用いる.本手法の有用性を示すために素朴な手法との比較実験行いその結果大幅な高速化が確認できたので報告する.更に,石原によって提案されたオンライン型近似抽出された頻出系列の候補系列に対して適用して高速化の効果を確認した.
抄録(英) In this paper, we give three fast algorithms for forward/backward subsumption and frequency-counting of subsequences, in order to extract maximal frequent subsequences in a very-long single data-sequence. We use Agrawal's hash-tree data structure for containing huge number of sequences, and also give a new index-table structure for memorizing occurrence positions of elements in sequences. We conducted some experiments, and confirmed the good performances of the algorithms proposed here.
キーワード(和) 極大頻出系列 / ハッシュ木 / 拡張インデックス
キーワード(英) maximal sequences / hash_tree / index_table / lossy_counting
資料番号 AI2006-13
発行日

研究会情報
研究会 AI
開催期間 2006/11/3(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 極大系列抽出を目的とする系列包含検査の高速化アルゴリズム(「さまざまな分野の形式的検証最前線」及びAI一般)
サブタイトル(和)
タイトル(英) Fast Algorithms for inclusion check in a sequence set to extract maximal sequences
サブタイトル(和)
キーワード(1)(和/英) 極大頻出系列 / maximal sequences
キーワード(2)(和/英) ハッシュ木 / hash_tree
キーワード(3)(和/英) 拡張インデックス / index_table
第 1 著者 氏名(和/英) 市川 博規 / Hiroki ICIHKAWA
第 1 著者 所属(和/英) 山梨大学大学院医学工学総合教育部 コンピュータ・メディア工学専攻
Interdisciplinary graduate School of Medicine arid Engineering, University of Yamanashi
第 2 著者 氏名(和/英) 岩沼 宏治 / Koji IWANUMA
第 2 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdisciplinary graduate School of Medicine arid Engineering, University of Yamanashi
第 3 著者 氏名(和/英) 鍋島 英知 / Hidetomo NABESHIMA
第 3 著者 所属(和/英) 山梨大学大学院医学工学総合研究部
Interdisciplinary graduate School of Medicine arid Engineering, University of Yamanashi
発表年月日 2006-11-10
資料番号 AI2006-13
巻番号(vol) vol.106
号番号(no) 340
ページ範囲 pp.-
ページ数 6
発行日