講演名 2018-11-05
[ポスター講演]階層型クラスタリングに基づく特徴選択のためのSelective Inference
鈴木 健太(名工大), 井上 茂乗(名工大), 梅津 佑太(名工大), 竹内 一郎(名工大/物質・材料研究機構/理研),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 遺伝子発現量データや顧客の購買履歴データなど, 背後に複数のクラスタを持つデータを分析し, 各クラスタに特有の傾向を発見することは重要な課題である. このような分析を行う際には, まず, クラスタリングによって複数のクラスタに分割する. そして, 各クラスタに固有の特徴を持つ変数の同定を行う. しかし, このようなクラスタリング後の推論を行う場合, クラスタリングによって生じるバイアスを考慮し, 適切に補正する必要がある. 本研究では, まず, クラスタごとで異なる平均構造をもつデータに対し, 階層型クラスタリングの一つであるウォード法を適用し, クラスタの階層構造を得る. 次に, Selective Inferenceの枠組みを利用することで, 各階層で得られたクラスタにおける各変数での検定を提案する. さらに, 人工データと実データの数値実験により, 提案手法の有用性を確認する.
抄録(英) It is important to find characteristic features behind the data from, e.g., gene expression level or customer's purchase history, by conducting clustering analysis. In this scenario, we first make clusters by some specific clustering methods, and then identify features those are characteristic to each cluster. However, when we perform a statistical inference after clustering, we have to take into account the bias suffered from the clustering and to correct it appropriately. In this paper, we first apply Ward method which is a famous one for hierarchical clustering to obtain a dendrogram. After that, we perform hypothesis testing for each variable in each branch by exploiting the framework of Selective Inference. Finally, we confirm the performance of the proposed method through synthetic and real data analysis.
キーワード(和) 仮説検定 / 階層型クラスタリング / ウォード法 / Selective Inference
キーワード(英) Hypothesis testing / Hierarchical Clustering / Ward Method / Selective Inference
資料番号 IBISML2018-70
発行日 2018-10-29 (IBISML)

研究会情報
研究会 IBISML
開催期間 2018/11/5(から3日開催)
開催地(和) 北海道民活動センター(かでる2.7)
開催地(英) Hokkaido Citizens Activites Center (Kaderu 2.7)
テーマ(和) 情報論的学習理論ワークショップ (IBIS2018)
テーマ(英) Information-Based Induction Science Workshop (IBIS2018)
委員長氏名(和) 鹿島 久嗣(京大)
委員長氏名(英) Hisashi Kashima(Kyoto Univ.)
副委員長氏名(和) 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事氏名(英) Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)
幹事補佐氏名(和) 岩田 具治(NTT) / 大羽 成征(京大)
幹事補佐氏名(英) Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Infomation-Based Induction Sciences and Machine Learning
本文の言語 JPN
タイトル(和) [ポスター講演]階層型クラスタリングに基づく特徴選択のためのSelective Inference
サブタイトル(和)
タイトル(英) [Poster Presentation] Selective Inference for Feature Selection after Hierarchical Clustering
サブタイトル(和)
キーワード(1)(和/英) 仮説検定 / Hypothesis testing
キーワード(2)(和/英) 階層型クラスタリング / Hierarchical Clustering
キーワード(3)(和/英) ウォード法 / Ward Method
キーワード(4)(和/英) Selective Inference / Selective Inference
第 1 著者 氏名(和/英) 鈴木 健太 / Kenta Suzuki
第 1 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 2 著者 氏名(和/英) 井上 茂乗 / Shigenori Inoue
第 2 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 3 著者 氏名(和/英) 梅津 佑太 / Yuta Umezu
第 3 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 4 著者 氏名(和/英) 竹内 一郎 / Ichiro Takeuchi
第 4 著者 所属(和/英) 名古屋工業大学/物質・材料研究機構/理化学研究所(略称:名工大/物質・材料研究機構/理研)
Nagoya Institute of Technology/National Institute for Materials Science/RIKEN(略称:NIT/NIMS/RIKEN)
発表年月日 2018-11-05
資料番号 IBISML2018-70
巻番号(vol) vol.118
号番号(no) IBISML-284
ページ範囲 pp.197-204(IBISML),
ページ数 8
発行日 2018-10-29 (IBISML)