講演抄録/キーワード |
講演名 |
2006-03-15 09:55
情報幾何に基づく混合分布パラメータの次元縮小法 ○赤穂昭太郎(産総研) |
抄録 |
(和) |
各学習サンプルが確率分布のパラメータとして与えられる場合の
次元縮小法が,さまざまな応用分野で重要となってきている.
従来,指数分布族に属する分布については情報幾何的な観点から
e-PCA, m-PCA という手法が提案されており,部分空間に自然な射影
を取ることができる上,確率分布としての意味を持つなど有用な
性質を持つ.
ところが,混合分布など実用上有用な分布は指数分布族に
入っておらず,従来手法が使えなかった. そこで本稿では,混合分布
の場合の次元圧縮法を提案する. 基本的なアイディアは,混合分布
を指数分布族に対応させることであるが,その対応は一意的でないのと,
コンポーネントの数が異なる混合分布同士の扱いが複雑になるという
問題がある.
提案手法では,これらの問題を線形計画問題による定式化や
貪欲算法を用いた準最適化を行う. |
(英) |
Dimension reduction for a set of distribution parameters
has been quite important in various kinds of applications.
The methods e-PCA and m-PCA
have been proposed from the information geometrical point of view
in the case of exponential family, and they are superior to
conventional PCA in the sense that natural projection gives
a meaning as probability distribution.
However, they cannot be directly applied
to practical and useful distributions such as mixture models that
do not belong to an exponential family. This paper proposes a
dimension reduction method for the mixture models. The basic idea is
embedding a mixture model into a space of an exponential family.
The problem is that the embedding is not unique and the dimensionality
of parameter space is not constant when the numbers of mixture components
are different.
Our method finds a quasi-optimal solution by solving the problem
greedily under formulation of linear programming problem. |
キーワード |
(和) |
情報幾何 / 指数分布族 / 平坦部分空間 / 射影 / 双対性 / 主成分分析 / 分散クラスタリング / |
(英) |
information geometry / exponential family / flat subspace / projection / duality / principal component analysis / distributed clustering / |
文献情報 |
信学技報, vol. 105, no. 657, NC2005-115, pp. 57-62, 2006年3月. |
資料番号 |
NC2005-115 |
発行日 |
2006-03-08 (NC) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|