講演名 | 1997/12/2 区間・領域分割を用いたRegression Treeの構成 石井 拓, 森本 康彦, 森下 真一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 近年データマイニング(data mining)がデータベース研究と人工知能研究の境界分野として注目を集めているが、そのなかの一トピックとしてデータベースからのregression tree構成がある。従来のregression tree構成においては内部ノードを分割する際そのノードに対応するデータセットをある単一属性の値がある定数値より小さいか否かで振り分ける手法(guillotine-cut)がとられてきたが、我々はそれに代わるものとして、データセットを2つの数値属性が張る平面中のある領域に含まれるか否かで振り分ける手法をその効率的な実現法とともに提案し、あわせて実装およぴ実験を行った。 |
抄録(英) | In recent years data mining has attracted many researchers among both artificial intelligence and database communities. Construction of regression trees is a topic of data mining. A regression tree is a rooted binary tree such that each internal node contains a test for splitting tuples into two disjoint classes. The mean of the objective attribute values at the leaf is used as the predicted value of the tuple. To test a numerical attribute, traditional methods use a guillotine-cut splitting that classifies data into those below a given value and others. In this paper, as an alternative of guillotine-cut splitting, we consider a family R of grid-regions in the plane associated with two given numeric attributes. And we propose to use a test that splits data into those that lie inside a region R and those that lie outside. Some experimental results showed that regression trees constructed through our method have higher accuracy than those through guillotine-cut splitting. |
キーワード(和) | データマイニング / 数値予測 / regression tree / 区間・領域分割 / 凸関数 |
キーワード(英) | data mining / numerical value prediction / regression tree / range and region splitting / convex function |
資料番号 | AI97-43 |
発行日 |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 1997/12/2(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Artificial Intelligence and Knowledge-Based Processing (AI) |
---|---|
本文の言語 | JPN |
タイトル(和) | 区間・領域分割を用いたRegression Treeの構成 |
サブタイトル(和) | |
タイトル(英) | Efficient Construction of Regression Trees with Range and Region Splitting |
サブタイトル(和) | |
キーワード(1)(和/英) | データマイニング / data mining |
キーワード(2)(和/英) | 数値予測 / numerical value prediction |
キーワード(3)(和/英) | regression tree / regression tree |
キーワード(4)(和/英) | 区間・領域分割 / range and region splitting |
キーワード(5)(和/英) | 凸関数 / convex function |
第 1 著者 氏名(和/英) | 石井 拓 / Hiromu Ishii |
第 1 著者 所属(和/英) | 東京大学理学系研究科情報料学専攻 Department of Information Science, University of Tokyo |
第 2 著者 氏名(和/英) | 森本 康彦 / Yasuhiko Morimoto |
第 2 著者 所属(和/英) | 日本IBM(株)東京基礎研究所 Tokyo Research Laboratory, IBM Japan Ltd. |
第 3 著者 氏名(和/英) | 森下 真一 / Shinichi Morishita |
第 3 著者 所属(和/英) | 東京大学医科学研究所 Institute of Medical Science, University of Tokyo |
発表年月日 | 1997/12/2 |
資料番号 | AI97-43 |
巻番号(vol) | vol.97 |
号番号(no) | 415 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |