講演名 2011-01-25
過去の事例をクラスタのラベル付けに利用した部分教師付きデータストリームからの学習(知能ソフトウェア工学)
小阪 達也, 安村 禎明, 上原 邦昭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,少量の正例のみにラベルが付与された部分教師付きデータストリームに対する学習手法を提案する。本手法では,ストリーム中のデータはchunkと呼ばれる一定数の事例ごとに分け,chunkごとに分類器を生成するアンサンブルアプローチをベースとしている.少量の正例のみがラベルを付与されているchunkから学習を行うために,本手法ではK-meansクラスタリングに過去のchunkのラベル付き正例を含めることで,ラベルのないデータから信頼度の高い負例を選択する.また,データストリームにおけるコンセプトチェンジを検出するために,新しく到着したchunkのラベル付き正例のクラスタと過去のラベル付き正例のクラスタ間の距離に基づいてクラスタごとに重みを付与する.人工のストリームデータを用いた実験により,提案手法の有効性を評価した.
抄録(英) This report presents a learning method for a partially supervised data stream that contains few labeled positive and unlabeled data. Instances in a data stream are divided into chunks, which contains a fixed size of instances. This method is based on the ensemble approach that builds classifiers from chunks. Then, in order to learn from a chunk, this method extracts reliable negative instances from unlabeled data using k-means clustering with labeled positives in the past chunks. To detect concept change in a data stream, clusters are assigned the weights based on the distance between the clusters containing labeled positives in the coming chunk and the clusters containing it in the past ones. The experiment results using an artificial data stream show the validity of the proposed method.
キーワード(和) データストリーム / 部分教師付き学習 / コンセプトチェンジ / K-meansクラスタリング / 過去の事例
キーワード(英) data stream / partially supervised learning / concept change / K-means clustering / past instances
資料番号 KBSE2010-41
発行日

研究会情報
研究会 KBSE
開催期間 2011/1/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 過去の事例をクラスタのラベル付けに利用した部分教師付きデータストリームからの学習(知能ソフトウェア工学)
サブタイトル(和)
タイトル(英) Learning from Partially Supervised Data Stream Using Past Instances To Label Clusters(Knowledge-Based Software Engineering)
サブタイトル(和)
キーワード(1)(和/英) データストリーム / data stream
キーワード(2)(和/英) 部分教師付き学習 / partially supervised learning
キーワード(3)(和/英) コンセプトチェンジ / concept change
キーワード(4)(和/英) K-meansクラスタリング / K-means clustering
キーワード(5)(和/英) 過去の事例 / past instances
第 1 著者 氏名(和/英) 小阪 達也 / Tatsuya KOSAKA
第 1 著者 所属(和/英) 神戸大学工学研究科情報知能学専攻
Department of Computer Science and Systems Engineering, Faculty of Engineering, Kobe University
第 2 著者 氏名(和/英) 安村 禎明 / Yoshiaki YASUMURA
第 2 著者 所属(和/英) 芝浦工業大学工学部
College of Engineering, Shibaura Institute of Technology
第 3 著者 氏名(和/英) 上原 邦昭 / Kuniaki UEHARA
第 3 著者 所属(和/英) 神戸大学工学研究科情報知能学専攻
Department of Computer Science and Systems Engineering, Faculty of Engineering, Kobe University
発表年月日 2011-01-25
資料番号 KBSE2010-41
巻番号(vol) vol.110
号番号(no) 386
ページ範囲 pp.-
ページ数 6
発行日