講演名 2014/1/23
アクターモデルに基づいたストリームデータに対する分散オンライン決定木学習手法の提案
山本 幸一, 櫻井 孝平, 山根 智,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ストリームデータに対する決定木構築において従来の決定木学習アルゴリズムは大規模データコンピューティングに向けた設計ではないため,実用に向かない.オンライン型決定木であるVFDTは,ストリームデータに対応した決定木学習手法であるが,より高頻度・大量のデータフローに対応することは難しく,複数のコンピュータで負荷を分散してデータを処理する必要がある.本稿ではデータフローを,メッセージパッシングにて木モデルにおける枝に対応させ複数のコンピュータに分散することで負荷を分散する手法を提案する.データの振り分けがそのままタスクの分散になり,流れるデータ自体が次の処理のトリガーとなるため,高速に,そのデータに合わせた処理を行うことが可能である.また,メッセージパッシングではデータの送信先を簡単に変更できることから,枝刈り,サブツリーの構築も簡単に行えるため,安定しないストリームデータにも対応できる.実装にはプログラミング言語Scalaにおけるactorを用いる.
抄録(英) Because the conventional decision tree learning algorithm is not designed for the large-scale data computing, it isn't practical for stream data. VFDT is an online decision tree algorithm and it supports the analysis of stream data, but, it is difficult to treat the data flow of high frequency, and large quantity. So it is necessary to construct The load sharing system for online decision tree learning. We propose the method that map a branch in tree model to a data flow by message passing in actor model and disperse the node in the tree model to plural machines for realizing the load sharing system. The system performs processing to the data by distributing tasks and a data flow becomes the trigger of the next processing. In addition, It is able to cope with the unstable stream data because the system easily performs to cut a branch or to construct the subtree by changing the transmission of data in the message passing. We use the actor library in programming language Scala for implementation.
キーワード(和) ストリームマイニング / オンライン型決定木 / 分散決定木 / アクターモデル
キーワード(英) Data stream mining / Online decision tree / Destributed decision tree / Actor model
資料番号 SS2013-58,MSS2013-61
発行日

研究会情報
研究会 SS
開催期間 2014/1/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Software Science (SS)
本文の言語 JPN
タイトル(和) アクターモデルに基づいたストリームデータに対する分散オンライン決定木学習手法の提案
サブタイトル(和)
タイトル(英) Distributed Online Decision Tree Learning for Stream Data Based on Actor Model
サブタイトル(和)
キーワード(1)(和/英) ストリームマイニング / Data stream mining
キーワード(2)(和/英) オンライン型決定木 / Online decision tree
キーワード(3)(和/英) 分散決定木 / Destributed decision tree
キーワード(4)(和/英) アクターモデル / Actor model
第 1 著者 氏名(和/英) 山本 幸一 / Koichi YAMAMOTO
第 1 著者 所属(和/英) 金沢大学自然科学研究科
Presently with Natural Science & Technology, Kanazawa University
第 2 著者 氏名(和/英) 櫻井 孝平 / Kohei SAKURAI
第 2 著者 所属(和/英) 金沢大学
Kanazawa University
第 3 著者 氏名(和/英) 山根 智 / Satoshi YAMANE
第 3 著者 所属(和/英) 金沢大学
Kanazawa University
発表年月日 2014/1/23
資料番号 SS2013-58,MSS2013-61
巻番号(vol) vol.113
号番号(no) 422
ページ範囲 pp.-
ページ数 6
発行日