講演名 2018-03-05
複数の距離計量を用いたk-近傍推定のための距離学習
關 翼人(早大), 村田 昇(早大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) グラフデータなどに代表される非構造化データでは,データ間の関係を表す距離計量が複数算出されることが多い.本稿では,データ間の複数の距離計量を用いたk-近傍推定のための距離学習を提案する.提案法ではデータ間の複数の距離計量における近傍関係から,目的の距離計量におけるデータ間の近傍関係を推定する.具体的には,決定木を用いて目的の距離計量における近傍関係を保持した小さなデータ集合への直和分解を行う.Random Forestにならいブートストラップサンプリングと分解に用いる距離計量の選択により,多様なパターンによるデータ集合の分解を行い,分解の結果からデータ間の近傍度を計算する.人工データおよび間取りデータを用いた実データ実験により,提案法による$k$-近傍推定における評価指標の向上を示す.
抄録(英) The relationship between unstructured datasets such as graphs can be measured by multiple distance metrics. In this paper, we propose a new metric learning method for $k$-nearest neighbor using multiple distance metrics. In our proposed method, the neighborhood relations with respect to the target distance metric are estimated from the neighborhood relations with respect to other multiple distance metrics. We use decision tree to direct sum decompose datasets to small datasets which holds the neighborhood relations with respect to the target distance metric. Following Random Forest, we use bootstrap sampling and sample distance to decompose datasets in various manners. The proximity among the datasets are calculated from the decomposition result. We conducted numerical experiments with an artificial datasets, and a real datasets concerning floor plan. The experiments show the improvement of accuracy.
キーワード(和) 距離学習 / k-近傍推定 / 決定木 / 非構造化データ
キーワード(英) Metric Learning / k-Nearest Neighbor Estimation / Decision Tree / Unstructured Data
資料番号 IBISML2017-92
発行日 2018-02-26 (IBISML)

研究会情報
研究会 IBISML
開催期間 2018/3/5(から2日開催)
開催地(和) 九州大学 西新プラザ
開催地(英) Nishijin Plaza, Kyushu University
テーマ(和) 統計数理・機械学習・データマイニング・一般
テーマ(英) Statisitical Mathematics, Machine Learning, Data Mining, etc.
委員長氏名(和) 福水 健次(統計数理研)
委員長氏名(英) Kenji Fukumizu(ISM)
副委員長氏名(和) 杉山 将(東大) / 鹿島 久嗣(京大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Hisashi Kashima(Kyoto Univ.)
幹事氏名(和) 竹内 一郎(名工大) / 津田 宏治(東大)
幹事氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.) / Koji Tsuda(Univ. of Tokyo)
幹事補佐氏名(和) 岩田 具治(NTT) / 神嶌 敏弘(産総研)
幹事補佐氏名(英) Tomoharu Iwata(NTT) / Toshihiro Kamishima(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) 複数の距離計量を用いたk-近傍推定のための距離学習
サブタイトル(和)
タイトル(英) Metric Learning for k-Nearest Neighbor Estimation using Multiple Distance Metrics
サブタイトル(和)
キーワード(1)(和/英) 距離学習 / Metric Learning
キーワード(2)(和/英) k-近傍推定 / k-Nearest Neighbor Estimation
キーワード(3)(和/英) 決定木 / Decision Tree
キーワード(4)(和/英) 非構造化データ / Unstructured Data
第 1 著者 氏名(和/英) 關 翼人 / Yokuto Seki
第 1 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 2 著者 氏名(和/英) 村田 昇 / Noboru Murata
第 2 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
発表年月日 2018-03-05
資料番号 IBISML2017-92
巻番号(vol) vol.117
号番号(no) IBISML-475
ページ範囲 pp.15-19(IBISML),
ページ数 5
発行日 2018-02-26 (IBISML)