大会名称
2008年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2008
発行日
2008/8/20
セッション番号
7
セッション名
データサイエンスで活躍する列挙アルゴリズム-設計技法とその応用-
講演日
2008/9/2
講演場所(会議室等)
第2イベント会場
講演番号
7-3
タイトル
大規模半構造データからの系列,木,グラフのマイニング
著者名
有村 博紀
キーワード
抄録
1990年代以降の高速ネットワークと大規模記憶装置の急速な発展を背景として,蓄積された大量のデータから有用な規則性やパターンを見つけるための効率よい手法であるデータマイニングの研究が盛んになっている.データマイニング研究は,1994年のビジネスデータにおける結合規則発見の研究を契機として顕在化し,データベースや,数理統計学,機械学習の境界分野として発展してきた.2000年以降の大きな流れとして,ウェブや,ゲノム,ストリームに代表される半構造データと呼ばれる多様な大規模データに対する高速なアルゴリズムの研究が注目されている.本講演では,この半構造データマイニングの基本的手法と最先端技術を紹介する.特に,半構造データを系列,木,グラフ等の離散構造としてモデル化し,列挙の観点から,高速なアルゴリズムの実現方法を解説する.また,半構造マイニングの知識発見への応用についてふれる.