講演名 2018-06-13
Post Clustering Inferenceとシングルセル解析への応用
井上 茂乗(名工大), 梅津 佑太(名工大), 坪田 庄真(名大), 竹内 一郎(名工大/理研/物質・材料研究機構),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 顧客データや遺伝子発現量データなど, 背後に複数のサブグループをもつようなデータは数多く存在する. このようなデータに対する解析手法の一つにクラスタリングがある. クラスタリングは, 標本の類似度に基づき, データをいくつかのクラスタに分割し, 得られたクラスタに関する何らかの知見を得ることを目標とする. そのため, クラスタリング結果から各クラスタの特徴を吟味することは, データの本質的な構造を理解するうえでも非常に重要な課題である. これまで, 数多くのクラスタリング手法に関する研究が行われてきたが, クラスタリング後の各クラスタの特徴に関する統計的推論についての議論はほとんどない. 本研究では, $K$平均法適用後の各クラスタの特徴における仮説検定を, Selective Inferenceの枠組みで定式化する. 提案手法を人工データと医療分野において注目を集めているシングルセルデータに対して適用することで, その有用性を確認する.
抄録(英) There are many data with several subgroups, such as customer data and gene expression data and so on. One way to analyze such data is clustering. It aims to divide the data into several clusters based on the similarity of samples and obtain knowledge on the resulting clusters. Therefore, examining the features of each cluster from the result of clustering is a very important task for understanding the essential structure of data. Various clustering methods have been studied so far, but none of them have focused on statistical guarantee for the features after clustering. In this study, we develop the framework of selective inference for a hypothesis testing problem of the features in each cluster after $K$-means clustering. We confirm the usefulness of the proposed method through synthetic data and single cell data analysis.
キーワード(和) 仮説検定 / $K$平均法 / Post Selection Inference / シングルセルデータ
キーワード(英) Hypothesis Testing / $K$-means Clustering / Post Selection Inference / Single Cell Data
資料番号 IBISML2018-3
発行日 2018-06-06 (IBISML)

研究会情報
研究会 NC / IBISML / IPSJ-BIO / IPSJ-MPS
開催期間 2018/6/13(から3日開催)
開催地(和) 沖縄科学技術大学院大学
開催地(英) Okinawa Institute of Science and Technology
テーマ(和) 機械学習によるバイオデータマインニング、一般
テーマ(英) Machine Learning Approach to Biodata Mining, and General
委員長氏名(和) 平田 豊(中部大) / 鹿島 久嗣(京大)
委員長氏名(英) Yutaka Hirata(Chubu Univ.) / Hisashi Kashima(Kyoto Univ.)
副委員長氏名(和) 庄野 逸(電通大) / 杉山 将(東大) / 津田 宏治(東大)
副委員長氏名(英) Hayaru Shouno(UEC) / Masashi Sugiyama(Univ. of Tokyo) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 吉川 大弘(名大) / 吉本 潤一郎(奈良先端大) / 竹内 一郎(名工大) / 神嶌 敏弘(産総研)
幹事氏名(英) Tomohiro Yoshikawa(Nagoya Univ.) / Junichiro Yoshimoto(NAIST) / Ichiro Takeuchi(Nagoya Inst. of Tech.) / Toshihiro Kamishima(AIST)
幹事補佐氏名(和) 稲垣 圭一郎(中部大) / 篠崎 隆志(NICT) / 岩田 具治(NTT) / 大羽 成征(京大)
幹事補佐氏名(英) Keiichiro Inagaki(Chubu Univ.) / Takashi Shinozaki(NICT) / Tomoharu Iwata(NTT) / Shigeyuki Oba(Kyoto Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Bioinformatics and Genomics / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 JPN
タイトル(和) Post Clustering Inferenceとシングルセル解析への応用
サブタイトル(和)
タイトル(英) Post Clustering Inference, with Application to Single Cell Analysis
サブタイトル(和)
キーワード(1)(和/英) 仮説検定 / Hypothesis Testing
キーワード(2)(和/英) $K$平均法 / $K$-means Clustering
キーワード(3)(和/英) Post Selection Inference / Post Selection Inference
キーワード(4)(和/英) シングルセルデータ / Single Cell Data
第 1 著者 氏名(和/英) 井上 茂乗 / Shigenori Inoue
第 1 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 2 著者 氏名(和/英) 梅津 佑太 / Yuta Umezu
第 2 著者 所属(和/英) 名古屋工業大学(略称:名工大)
Nagoya Institute of Technology(略称:NIT)
第 3 著者 氏名(和/英) 坪田 庄真 / Shouma Tsubota
第 3 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 4 著者 氏名(和/英) 竹内 一郎 / Ichiro Takeuchi
第 4 著者 所属(和/英) 名古屋工業大学/理化学研究所/物質・材料研究機構(略称:名工大/理研/物質・材料研究機構)
Nagoya Institute of Technology/RIKEN/National Institute for Materials Science(略称:NIT/RIKEN/NIMS)
発表年月日 2018-06-13
資料番号 IBISML2018-3
巻番号(vol) vol.118
号番号(no) IBISML-81
ページ範囲 pp.15-22(IBISML),
ページ数 8
発行日 2018-06-06 (IBISML)