講演名 2001/3/12
属性値処理と属性処理に基づくデータ前処理機構の考察
小森 麻央, 阿部 秀尚, 橘 恵昭, 山口 高平,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 知識発見プロセスは,大きくデータ前処理とデータマイニングに分けられる.本稿では,属性処理と属性値処理に焦点をあてて,シーズ属性に基づく属性集合の決定方法について実験を行い,評価した.属性選択法としては,すべての属性の組合せを探索することはごく小規模な問題でしか現実的でないため,属性の出現頻度を考慮した少数のシーズ属性集合に,属性値処理を適用し,その中から最良のものを初期属性集合とし,さらに逐次的に他の属性を付加しながらよりよい属性集合を選択していく方法を採用した.小規模な野球のデータに対してはこれらの方法論は有効であった.今後はもっと大規模なデータ集合に対しても実験を行い,より一般的な知見を得,前処理の支援環境に結びつけることが目標である..
抄録(英) This paper discuss a methodology for data preprocessing in KDD, forcusing on the construction of a set of good attributes. We start with a set of seed attributes that come uo frequency in data mining result in advance. They can be extended with other attributes while the incremental extention process provids mining result better than just before. We also do the following processing of attribute values : two convert numeric values to symbolic values or a symbolic values to group values for the purpose of reducing the serch space of irrelevant attributes, in order to evaluate our methodology we take a case study from baseball datasets. Five important attributes have been selected as seed as attributes and they can be extended with three other atributes. The eight attributes have shown best performance. All over the combination of attributes so our methodlogy van work over this small size case study. We will generalize and scall up our methodlogy to other large size of data sets.
キーワード(和) 知識発見 / データ前処理 / 属性選択 / 離散化 / スポーツ科学化
キーワード(英) knowredge discovery / data pre-processing / feature selection / discrete / sports science
資料番号 AI2000-77,KBSE85
発行日

研究会情報
研究会 AI
開催期間 2001/3/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 属性値処理と属性処理に基づくデータ前処理機構の考察
サブタイトル(和)
タイトル(英) A Data Preprocessing Mechanism Based on Processing Attribute values and Sellecting Attributes
サブタイトル(和)
キーワード(1)(和/英) 知識発見 / knowredge discovery
キーワード(2)(和/英) データ前処理 / data pre-processing
キーワード(3)(和/英) 属性選択 / feature selection
キーワード(4)(和/英) 離散化 / discrete
キーワード(5)(和/英) スポーツ科学化 / sports science
第 1 著者 氏名(和/英) 小森 麻央 / Mao KOMORI
第 1 著者 所属(和/英) 静岡大学情報学部
Dept. Computer Science, Shizuoka Univ.
第 2 著者 氏名(和/英) 阿部 秀尚 / Hidenao ABE
第 2 著者 所属(和/英) 静岡大学情報学部
Dept. Computer Science, Shizuoka Univ.
第 3 著者 氏名(和/英) 橘 恵昭 / Yoshiaki TACHIBANA
第 3 著者 所属(和/英) 静岡大学情報学部
Dept. Computer Science, Shizuoka Univ.
第 4 著者 氏名(和/英) 山口 高平 / Takahira YAMAGUCHI
第 4 著者 所属(和/英) 静岡大学情報学部
Dept. Computer Science, Shizuoka Univ.
発表年月日 2001/3/12
資料番号 AI2000-77,KBSE85
巻番号(vol) vol.100
号番号(no) 709
ページ範囲 pp.-
ページ数 2
発行日