大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
5G
セッション名
データマイニング
講演日
2009/09/03
講演場所(会議室等)
G会場(9号館2F 922教室)
講演番号
F-043
タイトル
精度保証付きオンライン型高速近似系列マイニング
著者名
村田 順平岩沼 宏治石原 龍一鍋島 英知
キーワード
データマイニング, オンラインアルゴリズム, 系列データ
抄録
我々は,ストリームデータ中に頻出する部分系列の抽出を目的とした高速近似オンラインアルゴリズムを提案する.提案手法は近似解を出力するが,その誤差は,ユーザが指定するパラメータ以下に抑えこめる.我々は,系列先頭頻度という部分系列の出現頻度のための尺度を導入し,ストリームデータから部分系列を抽出する.アルゴリズムの誤差と,メモリ使用量の理論値を求める.また,部分系列抽出問題はメモリ使用量が非常に大きいので,メモリ使用量を制限した場合のアルゴリズムとその誤差を示す.実験により,提案手法が系列データの長さに線形であることと,メモリ使用量を理論値以下に抑えていることを示す.
本文pdf
PDF download (143.7KB)