講演抄録/キーワード |
講演名 |
2014-05-29 14:45
線形混合モデルによるニュースコーパスの多重ラベル分類 ○加瀬雄一朗・三浦孝夫(法政大) KBSE2014-3 |
抄録 |
(和) |
本研究ではニュースコーパスをその内容に従って多重に分類する方式を提案する.
観測される少量の記事に関する情報を, 最もあり得る形で
生じたものと見なし最尤原理(Most Likelihood Principle)を用いて他の記事のクラス
を推定する.記事の単語出現が多項確率分布に従うと仮定し, 観測データを
用いてクラス推定を線形混合分布の枠組みで表現する.
複数のラベルからなるカテゴリは独立した意味を有することから,
ファジークラスタリングアルゴリズムを
用いて多重ラベル分類する. 実験で提案手法の有効性を確認し, 精度および
実行効率のいずれも優れた結果を得ることを述べる. |
(英) |
We propose a novel approach to classify news articles with multiple labels.
With small amount of articles considered as training data, we extract
probability distribution depending on each label based on most likeliness
estimation (MLE). We assume multi-nominal distribution over words,
we obtain class membership distribution within a framework of mixture models.
Then we apply fuzzy clustering approach to estimate multiple labels.
We discuss some experimental results to show how well the proposed
approach works. |
キーワード |
(和) |
分類 / 多重ラベル / EMアルゴリズム / ファジークラスタリング / / / / |
(英) |
Classification / Multi-Labelling / EM Algorithm / Fuzzy Clustering / / / / |
文献情報 |
信学技報, vol. 114, no. 66, KBSE2014-3, pp. 13-18, 2014年5月. |
資料番号 |
KBSE2014-3 |
発行日 |
2014-05-22 (KBSE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
KBSE2014-3 |