講演名 2022-06-28
MDL原理に基づくNML符号長を用いた離散変数の因果探索
小林 将理(東大), 西本 洋紀(東大), 松島 慎(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 有限個の観測データのみから確率変数間の因果構造を推測することは,科学における重要な問題の一つである.本稿では,離散変数データに対して,MDL原理に基づく多項分布モデルのNML符号長を用いた因果探索手法とBICを用いた手法を提案する.提案手法は2変数間の4通りの因果関係の推定を,直接モデル選択の問題として解くというアプローチを用いる.これらは離散変数の組に対する効率的かつ高精度な因果探索手法であり,特にNML符号長を用いたモデル選択手法は,より高い精度で因果関係の推定が行えることを人工データを使って示した.
抄録(英) Inference on the causal structure among random variables from only a finite number of observed data is one of the most important problems in science. This paper introduces causal inference methods for discrete variable data using NML code lengths for multinomial distribution models based on the MDL principle and BIC. These methods take an approach in which the estimation of a four-way causal relationship between two variables is directly solved as a model selection problem. We show that this approach is an efficient and accurate causal discovery method for discrete variable pairs using synthetic data. Further, we observed that the model selection method using the NML code length can estimate causal relationships with higher accuracy.
キーワード(和) 因果探索 / MDL原理 / NML符号長 / 離散変数 / BIC / ANMs
キーワード(英) Causal Discovery / MDL Principle / Stochastic Complexity / Discrete Data / BIC / ANMs
資料番号 NC2022-21,IBISML2022-21
発行日 2022-06-20 (NC, IBISML)

研究会情報
研究会 NC / IBISML / IPSJ-BIO / IPSJ-MPS
開催期間 2022/6/27(から3日開催)
開催地(和) 琉球大学50周年記念館
開催地(英)
テーマ(和) 機械学習によるバイオデータマイニング、一般
テーマ(英)
委員長氏名(和) 山川 宏(東大) / 杉山 将(東大)
委員長氏名(英) Hiroshi Yamakawa(Univ of Tokyo) / Masashi Sugiyama(Univ. of Tokyo)
副委員長氏名(和) 田中 宏和(東京都市大学) / 神嶌 敏弘(産総研) / 津田 宏治(東大)
副委員長氏名(英) Hirokazu Tanaka(Tokyo City Univ.) / Toshihiro Kamishima(AIST) / Koji Tsuda(Univ. of Tokyo)
幹事氏名(和) 寺島 裕貴(NTT) / 西田 知史(NICT) / 岩田 具治(NTT) / 中村 篤祥(北大)
幹事氏名(英) Hiroki Terashima(NTT) / Satoshi Nishida(NICT) / Tomoharu Iwata(NTT) / Atsuyoshi Nakamura(Hokkaido Univ.)
幹事補佐氏名(和) 田和辻 可昌(早大) / 栗川 知己(関西医科大) / 河原 吉伸(阪大) / 鈴木 大慈(東工大)
幹事補佐氏名(英) Yoshimasa Tawatsuji(Waseda Univ.) / Tomoki Kurikawa(KMU) / Yoshinobu Kawahara(Osaka Univ.) / Taiji Suzuki(Tokyo Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Neurocomputing / Technical Committee on Infomation-Based Induction Sciences and Machine Learning / Special Interest Group on Bioinformatics and Genomics / Special Interest Group on Mathematical Modeling and Problem Solving
本文の言語 JPN
タイトル(和) MDL原理に基づくNML符号長を用いた離散変数の因果探索
サブタイトル(和)
タイトル(英) Causal Discovery in Discrete Data Using NML Code Length Based on MDL Principle
サブタイトル(和)
キーワード(1)(和/英) 因果探索 / Causal Discovery
キーワード(2)(和/英) MDL原理 / MDL Principle
キーワード(3)(和/英) NML符号長 / Stochastic Complexity
キーワード(4)(和/英) 離散変数 / Discrete Data
キーワード(5)(和/英) BIC / BIC
キーワード(6)(和/英) ANMs / ANMs
第 1 著者 氏名(和/英) 小林 将理 / Masatoshi Kobayashi
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 2 著者 氏名(和/英) 西本 洋紀 / Nishimoto Hiroki
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
第 3 著者 氏名(和/英) 松島 慎 / Shin Mastushima
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:Todai)
発表年月日 2022-06-28
資料番号 NC2022-21,IBISML2022-21
巻番号(vol) vol.122
号番号(no) NC-89,IBISML-90
ページ範囲 pp.149-155(NC), pp.149-155(IBISML),
ページ数 7
発行日 2022-06-20 (NC, IBISML)