講演名 2012-11-07
ベイジアンネットワークを用いたLDAの特徴選択(第15回情報論的学習理論ワークショップ)
大畑 亮介, 植野 真臣,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,文書などの離散データにおける様々な特徴(著者など)を付加情報として組み込んだトピックモデルが注目されている.しかし,これまでの研究では特徴の選択方法については考慮されていない.本論では,特徴をデータ生成過程に取り入れたトピックモデルにおける特徴選択方法を提案する.具体的には,ベイジアンネットワークの枠組みを用いて特徴と潜在トピックの因果関係を明らかにし,データ生成に影響を与える特徴の組み合わせを選択する.本手法の利点は次の2つである.(1)評価する特徴の組み合わせごとに潜在トピックを学習する必要がないため計算効率が良い(2)統計的一致性を持つため特徴選択の精度が良い.シミュレーションにより提案手法の有効性を示す.
抄録(英) Recently there has been great interest in topic model analyzing discrete data accompanied by arbitrary features, such as authors. However, previous work in such topic modeling does not take account of feature selection. This paper presents a feature selection method for such topic model. The proposed method selects the feature set involving data generation by clarifying causality between the latent topic and features using bayesian network-based approach. The Advantages of the proposed method are as follows: First, computational time is short because the proposed method can select the feature set without learning latent topic of any combination of features. Second, feature selection accuracy is high because the proposed method has consistency. We demonstrate the effectiveness of the proposed method by simulation.
キーワード(和) トピックモデル / 特徴選択 / ベイジアンネットワーク
キーワード(英) topic model / feature selection / bayesian network
資料番号 IBISML2012-53
発行日

研究会情報
研究会 IBISML
開催期間 2012/10/31(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) ベイジアンネットワークを用いたLDAの特徴選択(第15回情報論的学習理論ワークショップ)
サブタイトル(和)
タイトル(英) Feature Selection for LDA using Bayesian Network
サブタイトル(和)
キーワード(1)(和/英) トピックモデル / topic model
キーワード(2)(和/英) 特徴選択 / feature selection
キーワード(3)(和/英) ベイジアンネットワーク / bayesian network
第 1 著者 氏名(和/英) 大畑 亮介 / Ryosuke OHATA
第 1 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, The University of Electro-Communications
第 2 著者 氏名(和/英) 植野 真臣 / Maomi UENO
第 2 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, The University of Electro-Communications
発表年月日 2012-11-07
資料番号 IBISML2012-53
巻番号(vol) vol.112
号番号(no) 279
ページ範囲 pp.-
ページ数 8
発行日