大会名称
2009年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2009
発行日
2009/8/20
セッション番号
7D
セッション名
データおよびWebマイニング
講演日
2009/09/04
講演場所(会議室等)
D会場(9号館1F 914教室)
講演番号
D-033
タイトル
データストリーム処理を高速・省メモリで行うためのスケッチ生成方式
著者名
海老山 知生喜田 弘司藤山 健一郎今井 照之中村 暢達
キーワード
データストリーム, スケッチ, データ要約
抄録
我々は,大量・連続的に発生する時系列データを,データの収集過程で流れ作業的に分析するデータストリーム処理方式の研究を進めている.データストリーム処理方式ではオリジナルデータは破棄し,スケッチと呼ばれる要約されたデータを保持して分析する.本稿では,スケッチの生成手法について提案する.スケッチ生成の課題は,データが揃っていない条件下で高精度かつ少サイズに要約しなければならない点である.この解決を目指し,データを複数の1次関数列で近似し,データが発生するたびに1次関数を修正する逐次要約方式を開発した.評価の結果,要約に伴う精度低下を平均6.5%程度に抑え,約1/15のデータ量に要約することができた.
本文pdf
PDF download (181.1KB)