講演名 2004/3/10
多項分布に基づく自己組織化マップの特性評価
福田 法旦, 斉藤 和巳, 石川 眞澄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 自己組織化マップ(SOM)では,単語頻度ベクトルと参照ベクトル間の距離として,通常はユークリッド距離が用いられている.また,ニューロン間の距離としてガウス分布を仮定した近傍関数がよく用いられる.本稿では,これらの距離定義として多項分布を用いたSOMについて考える.単語頻度ベクトルと参照ベクトル間の高次元距離には多項分布に基づく対数尤度を,ニューロン間の低次元距離には多項分布に基づく近傍を用いるSOMを定式化し,実験に基づいて評価する.多項分布に基づく対数尤度による距離定義では,ディリクレ型事前分布のスムージングパラメータを制御し,ゼロ頻度問題の緩和と分類性能への影響を調べる.実験は3種のベンチマーク文書データを用い,各文書間距離や各近傍関数における分類性能や自己組織化マップを比較する.
抄録(英) In this paper, we study how similarity definitions and neighborhood definitions in self-organizing maps (SOM) affect their classification performance. Conventional SOM uses a combination of a standard Euclidean norm for document similarity and a neighborhood definition based on a Gaussian distribution. We propose a novel SOM which adopts logarithmic likelihood based on multinomial distributions for document similarity, and neighborhood definition based on multinomial distributions. In computer experiments using three kinds of benchmark document data sets, we evaluate these SOM models from the points of view of the classification performances and resulting self-organizing maps.
キーワード(和) 自己組織化マップ / テキストマイニング / 多項分布
キーワード(英) self-organizing map / text mining / multinomial distribution
資料番号 NC2003-143
発行日

研究会情報
研究会 NC
開催期間 2004/3/10(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 多項分布に基づく自己組織化マップの特性評価
サブタイトル(和)
タイトル(英) Evaluation of Self-Organizing Maps based on Multinomial Distribution
サブタイトル(和)
キーワード(1)(和/英) 自己組織化マップ / self-organizing map
キーワード(2)(和/英) テキストマイニング / text mining
キーワード(3)(和/英) 多項分布 / multinomial distribution
第 1 著者 氏名(和/英) 福田 法旦 / Noriaki FUKUDA
第 1 著者 所属(和/英) 長岡技術科学大学電気電子情報工学課程
Nagaoka University of Technology
第 2 著者 氏名(和/英) 斉藤 和巳 / Kazumi SAITO
第 2 著者 所属(和/英) NTTコミュニケーション科学基礎研究所
NTT Communication Science Laboratories
第 3 著者 氏名(和/英) 石川 眞澄 / Masumi ISHIKAWA
第 3 著者 所属(和/英) 九州工業大学大学院生命体工学研究科
Kyushu Institute of Technology
発表年月日 2004/3/10
資料番号 NC2003-143
巻番号(vol) vol.103
号番号(no) 732
ページ範囲 pp.-
ページ数 6
発行日