講演名 1994/10/21
線形識別器における学習曲線の実験的検討
松永 務, 木田 博巳,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 文字や音声の認識に適用される統計識別器の識別性能は学習サンプルサイズに大きく依存する。一般に多くのサンプルを収集するには多大な時間やコストを必要とするため、扱い得る限られたサンプルを最大限に活用する識別器の設計アプローチが、有効な認識系の構築において求められている。学習サンプル数増加に伴う誤識別率の減少の関係の記述は学習曲線と呼ばれ、学習サンプルサイズの効果の漸近的な振る舞いを定量的に示す。本稿では、統計的パターン認識における代表的な識別器である二次識別器、Fisher線形識別器およびユークリッド距離識別器を取り上げ、学習サンプルサイズの効果を学習曲線により評価する。多次元正規分布で事前確率の等しい2クラスの識別問題において次元数やパターン分布形状に関連しながら誤識別率は学習サンプルサイズに応じてどのように変動するかをモンテカルロ・シミュレーションによる実験結果から示す。
抄録(英) In pattern recognition systems using statistical classifiers like character recognition systems and speech recognition systems, classification performance depends considerably on training sample size.Since collecting many samples,in general,requires time and cost,design approach which make optimal use of the finite number of available samples is needed in the development of recognition systems.Learning curves exhibit asymptotic behaviors where the probability of misclassification decreases as a number of training samples increases.In this paper,effects of training sample size are evaluated by using a learning curve for quadratic discriminant function,Fisher's linear discriminant function and Euclidean distance classfier.Two class problems having equiprobable multivariate normal distributions are considered for pattern distributions controlled with known population parameters.This paper presents asymptotic behaviors,through experimental resuits.
キーワード(和) 識別器設計 / サンプル数 / 次元数 / 誤識別率 / 学習曲線
キーワード(英) classifier design / sample size / dimensionality / misclassification rate / learning curve
資料番号 PRU94-56
発行日

研究会情報
研究会 PRU
開催期間 1994/10/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Understanding (PRU)
本文の言語 JPN
タイトル(和) 線形識別器における学習曲線の実験的検討
サブタイトル(和)
タイトル(英) An Experimental Study of Learning Curve on Linear Classifiers
サブタイトル(和)
キーワード(1)(和/英) 識別器設計 / classifier design
キーワード(2)(和/英) サンプル数 / sample size
キーワード(3)(和/英) 次元数 / dimensionality
キーワード(4)(和/英) 誤識別率 / misclassification rate
キーワード(5)(和/英) 学習曲線 / learning curve
第 1 著者 氏名(和/英) 松永 務 / Tsutomu Matsunaga
第 1 著者 所属(和/英) NTTデータ通信
Data Communications Systems,NTT Corporation
第 2 著者 氏名(和/英) 木田 博巳 / Hiromi Kida
第 2 著者 所属(和/英) NTTデータ通信
Data Communications Systems,NTT Corporation
発表年月日 1994/10/21
資料番号 PRU94-56
巻番号(vol) vol.94
号番号(no) 294
ページ範囲 pp.-
ページ数 8
発行日