論文賞 推薦の辞
Pattern Recognition with Gaussian Mixture Models of Marginal Distributions
大町 方子 ・ 大町真一郎
(英文論文誌D 平成23年2月号掲載)
 統計的パターン認識において,サンプルの分布を表す確率密度関数のパラメータを精度よく推定することは,高い認識精度を達成するために重要である.現在,ウェブを利用して大量のサンプルを収集できるパターン認識の課題においてはこの問題は克服されつつあるが,それ以外の課題ではサンプルの収集コストが莫大となることから,パラメータの推定精度の改善や,クラス分離の良い特徴量の開発などが行われている.ただし,特徴ベクトルの次元が高く,かつサンプル数が少ない場合には,高い精度で確率密度関数のパラメータを推定することはほぼ不可能となるため,現在でも挑戦的な課題として多くの研究者が取り組んでいる問題である.
  本論文では,このような困難な問題を緩和するための一つのアプローチとして,特徴ベクトルの成分を二分割するアイデアが提案されている.具体的には,分割した部分集合同士の相関を小さく,また同一集合内の成分同士の相関が大きくなるようにグラフ分割問題によって特徴ベクトルの成分を二分割する.この分割の後,二つの部分訓練サンプル集合に対して,独立に混合ガウス分布をフィッティングし,それらを確率密度関数とした最大事後確率則によりパターン認識を行う.これにより, 同じカテゴリ内のパターン変動を上手く吸収できる部分集合が作成でき,さらに特徴ベクトルの次元が相対的に低くなることから,サンプル数が少なくても精度よく確率密度関数のパラメータが推定できるようになると考えられる.
  実際,手書き数字認識で良く用いられる標準データセットであるMNISTを用いた実験では,提案手法により,特徴ベクトルの成分が二つの部分集合に精度良く分離できていることが確認できる.また,認識に関しても,特に訓練サンプル数が少ないときに,モデル構築に必要な計算時間の削減と,未知サンプルに対する認識率の向上が確認できる.さらに,視覚的に混合ガウス分布のフィッティングの状態を観察すると,従来手法と比べて適切なモデルが構築されていることが確認できる.提案手法はシンプルでありながら,パターン認識の応用において直面する少数サンプル問題に対応できる汎用的手法であるといえ,論文賞にふさわしいものとして高く評価できる.

CLOSE