講演名 2017-06-22
正規化相互情報量を用いた確率的潜在意味解析解の多様性の検討
内山 俊郎(北海道情報大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 確率的潜在意味解析および潜在的ディリクレ配分モデルは,画像や文書などのデータ解析に有用なトピックモデルとして知られる.トピックモデルにおけるパラメータ推定では,初期値設定の違いなどにより,さまざまな解が得られる.このような解の多様性を活かすには,解の分布構造を知ることが必要である.そこで,本研究では,推定したトピックモデルのパラメータ(解)間の類似性(内積)を定義し,分析する方法を提案する.文書データに対する実験により,トピックモデルの解同士あるいはクラスタリング解との関係性などが得られ,提案手法の有用性を確認した.
抄録(英) Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet analysis are known as topic models to analyze text data and images. Many different parameters (solutions) of a topic model can be obtained due to different initial conditions. To utilize diversity of solutions, it is necessary to acquire distribution structure of them. Therefore, this paper proposes a novel method to define similarity (inner product) of solutions using normalized mutual information to analyze distribution of solutions. Experimental results for text data arepresented to show the usefulness of proposed method.
キーワード(和) トピックモデル / PLSA / 解の多様性 / 正規化相互情報量 / 情報理論的クラスタリング
キーワード(英) topic model / PLSA / diversity of solutions / normalized mutual information / information-theoretic clustering
資料番号 PRMU2017-31,SP2017-7
発行日 2017-06-15 (PRMU, SP)

研究会情報
研究会 PRMU / SP
開催期間 2017/6/22(から2日開催)
開催地(和) 東北大学
開催地(英)
テーマ(和) 様々なメディア
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 山下 洋一(立命館大)
委員長氏名(英) Shinichi Sato(NII) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 藤吉 弘亘(中部大) / 井尻 善久(オムロン) / 森 大毅(宇都宮大)
副委員長氏名(英) Hironobu Fujiyoshi(Chubu Univ.) / Yoshihisa Ijiri(Omron) / Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 西田 昌史(静岡大) / 坂野 秀樹(名城大)
幹事氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 橋本 佳(名工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Speech
本文の言語 JPN
タイトル(和) 正規化相互情報量を用いた確率的潜在意味解析解の多様性の検討
サブタイトル(和)
タイトル(英) Investigation of solution diversity about probabilistic latent semantic analysis using normalized mutual information
サブタイトル(和)
キーワード(1)(和/英) トピックモデル / topic model
キーワード(2)(和/英) PLSA / PLSA
キーワード(3)(和/英) 解の多様性 / diversity of solutions
キーワード(4)(和/英) 正規化相互情報量 / normalized mutual information
キーワード(5)(和/英) 情報理論的クラスタリング / information-theoretic clustering
第 1 著者 氏名(和/英) 内山 俊郎 / Toshio Uchiyama
第 1 著者 所属(和/英) 北海道情報大学(略称:北海道情報大)
Hokkaido Information University(略称:Hokkaido Info. Univ.)
発表年月日 2017-06-22
資料番号 PRMU2017-31,SP2017-7
巻番号(vol) vol.117
号番号(no) PRMU-105,SP-106
ページ範囲 pp.33-38(PRMU), pp.33-38(SP),
ページ数 6
発行日 2017-06-15 (PRMU, SP)