講演名 2006-03-16
統計的決定理論に基づく複数のクラスに属する文書の分類方法に関する一考察(情報通信基礎サブソサイエティ合同研究会)
前田 康成, 吉田 秀樹, 藤原 祥隆, 松嶋 敏泰,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,人工知能の自然言語処理の分野において,複数クラスに属する文書の分類問題に関する研究が数多く行われている.文書の生成に確率モデルを採用した従来研究では確率モデルの未知パラメータの推定と文書分類という二つの問題に分けて検討しており,一つの統計的決定問題として定式化していない.また,文書内におけるクラスの変化も十分に表現できないモデルである.そこで,本研究ではクラスの変化が表現可能なモデルを採用し,統計的決定理論に基づき一つの統計的決定問題として定式化し直すことによって,誤り率をベイズ基準のもとで最小にする分類方法を導出するとともに,計算量を削減した近似アルゴリズムも提案する.
抄録(英) In this paper we treat multi-topic document classification problem. In previous researches some theoretical optimality is guaranteed when the number of data for learning is infinite. We propose new multi-topic document classification methods that minimize error rate with reference to the Bayes criterion when the number of data for learning is finite. And we also propose approximate algorithms in order to reduce computational complexity.
キーワード(和) 文書分類 / 複数のクラスに属する文書 / 統計的決定理論 / 誤り率
キーワード(英) document classification / multi-topic document / statistical decision theory / error rate
資料番号 IT2005-89,ISEC2005-146,WBS2005-103
発行日

研究会情報
研究会 ISEC
開催期間 2006/3/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information Security (ISEC)
本文の言語 JPN
タイトル(和) 統計的決定理論に基づく複数のクラスに属する文書の分類方法に関する一考察(情報通信基礎サブソサイエティ合同研究会)
サブタイトル(和)
タイトル(英) A Note on Multi-topic Document Classification Method Based upon Statistical Decision Theory
サブタイトル(和)
キーワード(1)(和/英) 文書分類 / document classification
キーワード(2)(和/英) 複数のクラスに属する文書 / multi-topic document
キーワード(3)(和/英) 統計的決定理論 / statistical decision theory
キーワード(4)(和/英) 誤り率 / error rate
第 1 著者 氏名(和/英) 前田 康成 / Yasunari MAEDA
第 1 著者 所属(和/英) 北見工業大学工学部
Dept. of Computer Sciences, Kitami Institute of Technology
第 2 著者 氏名(和/英) 吉田 秀樹 / Hideki YOSHIDA
第 2 著者 所属(和/英) 北見工業大学工学部
Dept. of Computer Sciences, Kitami Institute of Technology
第 3 著者 氏名(和/英) 藤原 祥隆 / Yoshitaka FUJIWARA
第 3 著者 所属(和/英) 北見工業大学工学部
Dept. of Computer Sciences, Kitami Institute of Technology
第 4 著者 氏名(和/英) 松嶋 敏泰 / Toshiyasu MATSUSHIMA
第 4 著者 所属(和/英) 早稲田大学理工学部
School of Science and Engineering, Waseda University
発表年月日 2006-03-16
資料番号 IT2005-89,ISEC2005-146,WBS2005-103
巻番号(vol) vol.105
号番号(no) 663
ページ範囲 pp.-
ページ数 6
発行日