講演名 2007-05-19
電子掲示板の多重ロジスティック潜在変数モデルを用いたキーワード分析(e-Learningの基盤技術/一般)
植野 真臣, 岡本 敏雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では、電子掲示板での議論を形態素解析し、(1)新しいキーワードの重要度の定義とキーワード自動抽出への応用、(2)多重ロジスティック潜在変数モデルによるキーワード特性と発言者特性の多次元尺度上への同時可視化手法、を提案し、実際の電子掲示板にオンライン解析システムとして実装した。本手法の利点は、1.確率モデルを導入することにより、最尤推定法、ベイズ推定法などを用いることができ、推定値に漸近一致性を持つ、2.MDLなどの情報量基準を用いることができ、予測効率最大となるパラメータ数を決定することができる、3.キーワードの重要度の定義が容易に行え、キーワード分析や要約システムに応用ができる、4.多重ロジスティック潜在変数モデルは計算が容易で大量データに対しても比較的高速に演算できる、5.多重ロジスティック潜在変数モデルは、予測精度が最も良いとされるベイジアンネットワークの同時確率分布の良い近似を与える、が挙げられる。本研究では、実際のLMSに上の機能を持つシステムを実装し、その有効性を示した。
抄録(英) This study proposes (1) A new definition of the kewords weights in the morphological analysis of the discussion in the electro bullitein board and it's application to the automatic keywords extraction system, and (2) Visualization method of the keywords characteristics and the contributers characteristics using the multivariate latent logistic model. The advantages of the proposed method are 1. the estimators have the asymptotic consistency using the maximum likelihood method or Bayesian estimation method, 2. The method can decide the optimum number of the parameters using the information criteria as like MDL, 3. It is easy to define the keywords weights, they can be applied to the keywords analysis and abstraction system, 4. the multivariate latent logistic model is easy to calculate the huge data, and 5. the multivariate latent logistic model provides good approximation of the Bayesian network model which is well known good prediction model. This study implemented the proposed functions into the electro bullitein board and show the effectiviness.
キーワード(和) テキスト・マイニング / キーワード分析 / 多重ロジスティック潜在変数モデル / 可視化システム
キーワード(英) Text Mining / Keywords Analysis / the multivariate latent logistic model / visualization system
資料番号 ET2007-3
発行日

研究会情報
研究会 ET
開催期間 2007/5/12(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Educational Technology (ET)
本文の言語 JPN
タイトル(和) 電子掲示板の多重ロジスティック潜在変数モデルを用いたキーワード分析(e-Learningの基盤技術/一般)
サブタイトル(和)
タイトル(英) Keywords analysis of electronic bulletin board using the multivariate latent logistic model
サブタイトル(和)
キーワード(1)(和/英) テキスト・マイニング / Text Mining
キーワード(2)(和/英) キーワード分析 / Keywords Analysis
キーワード(3)(和/英) 多重ロジスティック潜在変数モデル / the multivariate latent logistic model
キーワード(4)(和/英) 可視化システム / visualization system
第 1 著者 氏名(和/英) 植野 真臣 / Maomi UENO
第 1 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
The University of Electro-Communications
第 2 著者 氏名(和/英) 岡本 敏雄 / Toshio OKAMOTO
第 2 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
The University of Electro-Communications
発表年月日 2007-05-19
資料番号 ET2007-3
巻番号(vol) vol.107
号番号(no) 48
ページ範囲 pp.-
ページ数 6
発行日