電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2006-10-17 14:50
ルール生成に必要なデータ量に関するランダム性に基づいた解析
原口和也京大)・柳浦睦憲名大)・Endre BorosRutgers Univ.)・茨木俊秀関西学院大
抄録 (和) 与えられたデータ集合からルールを生成・列挙する問題は.データマイニングやバイオインフォマティクス等の分野に応用を持つ.本研究で取り扱うデータ集合は事例の集合であり,各事例は $n$ 次元 0-1 ベクトルで表され,真偽いずれかのラベルを与えられているものとする.ルールとは真の事例集合に頻出し,偽の事例集合に非頻出な変数の値の組(パターン)である.データ集合のサイズが小さければ,データが持つ本来の構造とはかけ離れたルールが含まれると考えられる.本稿では,このようなルールを持たない為に必要なデータ集合のサイズを考え,出鱈目な領域のデータではルールが存在しないだけの数が必要という仮説を立て,実験によって検証する.また,必要なデータのサイズの上界を確率的解析によって導く. 
(英) We consider a two-labeled data set $X=X_1\cup X_0$ in which each xample is a Boolean vector. A pattern is a co-occurrence of a particular value combination of some variables. If a pattern appears frequently in $X_1$ and infrequently in $X_0$, we call it a good pattern. In this article, we discuss the data size needed for removing ``deceptive'' good patterns; if $X$ is small, many good patterns may appear independently of the underlying structure. We hypothesize that $X$ should contain more number of examples than that at which a random data set contains few good patterns. We justify this hypothesis by computational studies, and derive a theoretical upper bound on the needed data size in view of our hypothesis.
キーワード (和) 頻出/非頻出集合 / 相関ルール / 知識発見 / 確率的解析 / / / /  
(英) frequent/infrequent item sets / association rules / knowledge discovery / probabilistic analysis / / / /  
文献情報 信学技報, vol. 106, no. 289, COMP2006-38, pp. 57-64, 2006年10月.
資料番号 COMP2006-38 
発行日 2006-10-10 (COMP) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
PDFダウンロード

研究会情報
研究会 COMP  
開催期間 2006-10-17 - 2006-10-17 
開催地(和) 東北大学 
開催地(英) Tohoku University 
テーマ(和)  
テーマ(英)  
講演論文情報の詳細
申込み研究会 COMP 
会議コード 2006-10-COMP 
本文の言語 日本語 
タイトル(和) ルール生成に必要なデータ量に関するランダム性に基づいた解析 
サブタイトル(和)  
タイトル(英) A Randomness Based Analysis on the Data Size Needed for Generating Reliable Rules 
サブタイトル(英)  
キーワード(1)(和/英) 頻出/非頻出集合 / frequent/infrequent item sets  
キーワード(2)(和/英) 相関ルール / association rules  
キーワード(3)(和/英) 知識発見 / knowledge discovery  
キーワード(4)(和/英) 確率的解析 / probabilistic analysis  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 原口 和也 / Kazuya Haraguchi / ハラグチ カズヤ
第1著者 所属(和/英) 京都大学 (略称: 京大)
Kyoto University (略称: Kyoto Univ.)
第2著者 氏名(和/英/ヨミ) 柳浦 睦憲 / Mutsunori Yagiura / ヤギウラ ムツノリ
第2著者 所属(和/英) 名古屋大学 (略称: 名大)
Nagoya University (略称: Nagoya Univ.)
第3著者 氏名(和/英/ヨミ) Endre Boros / Endre Boros / Endre Boros
第3著者 所属(和/英) Rutgers University (略称: Rutgers Univ.)
Rutgers University (略称: Rutgers Univ.)
第4著者 氏名(和/英/ヨミ) 茨木 俊秀 / Toshihide Ibaraki / イバラキ トシヒデ
第4著者 所属(和/英) 関西学院大学 (略称: 関西学院大)
Kwansei Gakuin University (略称: Kwansei Gakuin Univ.)
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2006-10-17 14:50:00 
発表時間 35 
申込先研究会 COMP 
資料番号 IEICE-COMP2006-38 
巻番号(vol) IEICE-106 
号番号(no) no.289 
ページ範囲 pp.57-64 
ページ数 IEICE-8 
発行日 IEICE-COMP-2006-10-10 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会