講演名 2003/3/7
多属性データに対する前処理の木構造を用いたモデル化(<特集>「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
山田 有吉, 市瀬 龍太郎, 沼尾 正行,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) データベースに蓄積された膨大なデータから有用な知識を獲得するKDDプロセスにおいて,データを整理・加工する前処理の重要性は,多くの専門家によって指摘されている.しかし,前処理を専門に扱った研究やツールの開発は十分に進展していないのが現状である.そこで本研究では,試行錯誤的に行われてきた前処理に対する独自のモデル化を行い,複雑な処理群を半自動的にサポートするシステムを提案した.本研究では,視認性が高く,柔軟に構造変更を行うことのできる木構造を用いることにより,多くの属性を伴う複雑なデータに対する処理を,効率よく行うことを可能にした.また,実際の医療データに対して実験を行い,提案システムの有用性に対する検証を行った.
抄録(英) Knowledge discovery in databases (KDD) requires huge data, which takes a long time to be preprocessed. Although each element of pre-processing is simple, it tends to be quite complicated and is hard to construct the whole plan. To reduce the load, we propose the original model for pre-processing and an interactive and dynamic planning tool for pre-processing, named TransX. This system is based on XML transformation, which enables to visualize the process by using a treelike notation and it allows a user to process data easily and understandably. We propose the original model for preprocessing scheme, which enables to define the preprocessing plan simply, and shows how the system, TransX, carries out the plan concretely
キーワード(和) KDD / 前処理 / データマイニング / 木構造
キーワード(英) KDD / preprocessing / data mining / layered structure
資料番号 AI2002-73
発行日

研究会情報
研究会 AI
開催期間 2003/3/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 多属性データに対する前処理の木構造を用いたモデル化(<特集>「アクティブマイニング」及び一般 : 文部科学省科学研究費特定領域研究「情報洪水時代におけるアクティブマイニングの実現」公開シンポジウム)
サブタイトル(和)
タイトル(英) An Effective Pre-processing Model Using Layered Structure
サブタイトル(和)
キーワード(1)(和/英) KDD / KDD
キーワード(2)(和/英) 前処理 / preprocessing
キーワード(3)(和/英) データマイニング / data mining
キーワード(4)(和/英) 木構造 / layered structure
第 1 著者 氏名(和/英) 山田 有吉 / Yukichi Yamada
第 1 著者 所属(和/英) 東京工業大学計算工学専攻
Department of Computer Science, Tokyo Institute of Tech
第 2 著者 氏名(和/英) 市瀬 龍太郎 / Ryutaro Ichise
第 2 著者 所属(和/英) 国立情報学研究所知能システム研究系
Intelligent Systems Research Division, National Institute of Informatics
第 3 著者 氏名(和/英) 沼尾 正行 / Masayuki Numao
第 3 著者 所属(和/英) 東京工業大学計算工学専攻
Department of Computer Science, Tokyo Institute of Tech
発表年月日 2003/3/7
資料番号 AI2002-73
巻番号(vol) vol.102
号番号(no) 710
ページ範囲 pp.-
ページ数 6
発行日