講演名 2014-05-29
線形混合モデルによるニュースコーパスの多重ラベル分類
加瀬 雄一朗, 三浦 孝夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究ではニュースコーパスをその内容に従って多重に分類する方式を提案する.観測される少量の記事に関する情報を,最もあり得る形で生じたものと見なし最尤原理(Most Likelihood Principle)を用いて他の記事のクラスを推定する.記事の単語出現が多項確率分布に従うと仮定し,観測データを用いてクラス推定を線形混合分布の枠組みで表現する.複数のラベルからなるカテゴリは独立した意味を有することから,ファジークラスタリングアルゴリズムを用いて多重ラベル分類する.実験で提案手法の有効性を確認し,精度および実行効率のいずれも優れた結果を得ることを述べる.
抄録(英) We propose a novel approach to classify news articles with multiple labels. With small amount of articles considered as training data, we extract probability distribution depending on each label based on most likeliness estimation (MLE). We assume multi-nominal distribution over words, we obtain class membership distri- bution within a framework of mixture models. Then we apply fuzzy clustering approach to estimate multiple labels. We discuss some experimental results to show how well the proposed approach works.
キーワード(和) 分類 / 多重ラベリング / EMアルゴリズム / ファジークラスタリング
キーワード(英) Classification / Multi-Labelling / EM Algorithm / Fuzzy Clustering
資料番号 KBSE2014-3
発行日

研究会情報
研究会 KBSE
開催期間 2014/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 線形混合モデルによるニュースコーパスの多重ラベル分類
サブタイトル(和)
タイトル(英) Multi-Label Classification of News Corpus using Linear Mixture Models
サブタイトル(和)
キーワード(1)(和/英) 分類 / Classification
キーワード(2)(和/英) 多重ラベリング / Multi-Labelling
キーワード(3)(和/英) EMアルゴリズム / EM Algorithm
キーワード(4)(和/英) ファジークラスタリング / Fuzzy Clustering
第 1 著者 氏名(和/英) 加瀬 雄一朗 / Yuichiro KASE
第 1 著者 所属(和/英) 法政大学理工学部創生科学科
Hosei University
第 2 著者 氏名(和/英) 三浦 孝夫 / Takao MIURA
第 2 著者 所属(和/英) 法政大学理工学部創生科学科
Hosei University
発表年月日 2014-05-29
資料番号 KBSE2014-3
巻番号(vol) vol.114
号番号(no) 66
ページ範囲 pp.-
ページ数 6
発行日