講演名 2022-01-23
e(m)-PCAを用いた2クラス分類に向けて
藤木 淳(福岡大), 赤穂 昭太郎(産総研),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) これまでの多くのデータ分析手法は,測定値そのものをデータとして扱い,そのデータを線形もしくは非線形写像によって高次元ユークリッド空間である特徴空間の点へと写像した後にユークリッド距離に基づいて分析を行っている.しかし,個人の測定値の集合を1つのデータと考えて複数人のデータ解析を行う場合,測定値そのものをデータと扱うよりも個人に付随する測定値の集合を1つの確率分布と考えた方が個人間の比較が容易であると考えられる.そこで本稿では観測値そのものをデータとして扱うのではなく,確率分布をデータとして扱う,つまり点として扱うデータ分析手法について考える.この際,確率分布の(擬)距離としてKullback?Leibler ダイバージェンスのような非対称距離を用いるので,これまでのユークリッド距離に基づく分析手法を単純に適用することが難しい.これまで,確率分布をデータとして扱う Kullback?Leibler ダイバージェンスに基づいたデータ分析手法として,主成分分析(e(m)-PCA),クラスタリング,次元圧縮を伴なうクラスタリングが提案されてきたが,確率分布に対する教師あり学習としての判別分析は提案されてこなかった.そこで本稿では Kullback?Leibler ダイバージェンスに基づく判別分析手法に向けてのプロトタイプ手法として e(m)-PCA に基づく判別分析手法を提案する.
抄録(英) In many data analysis methods, observed data are treated as points in high-dimensional Euclidean space, called feature space by using linear and/or non-linear mapping from observed data into points in the feature space, and data are analized based on Euclidean distance. To compare among individuals when each individual has a set of data, each set of data should be regarded as a probabilistic distribution rather than points in high-dimensional Euclidean space, to understand the difference among individuals. Therefore, in this paper, we consider a data analysis method that treats probabilistic distributions as data points in a certain manifold. In this framework, it is difficult to apply the usual data analysis methods based on the Euclidean disntance because asymmetric distances such as the Kullback-Leibler divergence is used as the (pseudo-)distance of the probabilistic distribution. So far, principal component analysis, clustering, and clustering with dimension reduction have been proposed as data analysis for probabilistic distribution. However, discriminant analysis as supervised learning for probabilistic distribution is not proposed yet. Then in this paper, we propose a discriminant analysis method based on e(m)-PCA as a prototype method toward a discriminant analysis method based on Kullback-Leibler divergence.
キーワード(和) 情報幾何 / Kullback?Leibler ダイバージェンス / 主成分分析 / 判別分析
キーワード(英) information geometry / Kullback?Leibler divergence / principal component analysis / discriminant analysis
資料番号 NC2021-43
発行日 2022-01-14 (NC)

研究会情報
研究会 NLP / MICT / MBE / NC
開催期間 2022/1/21(から3日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) NC, ME,MICT,NLP, 一般
テーマ(英)
委員長氏名(和) 高坂 拓司(中京大) / 花田 英輔(佐賀大) / 奥野 竜平(摂南大) / 大須 理英子(早大)
委員長氏名(英) Takuji Kosaka(Chukyo Univ.) / Eisuke Hanada(Saga Univ.) / Ryuhei Okuno(Setsunan Univ.) / Rieko Osu(Waseda Univ.)
副委員長氏名(和) 常田 明夫(熊本大) / 田中 宏和(広島市大) / 安在 大祐(名工大) / 堀 潤一(新潟大) / 山川 宏(東大)
副委員長氏名(英) Akio Tsuneda(Kumamoto Univ.) / Hirokazu Tanaka(Hiroshima City Univ.) / Daisuke Anzai(Nagoya Inst. of Tech.) / Junichi Hori(Niigata Univ.) / Hiroshi Yamakawa(Univ of Tokyo)
幹事氏名(和) 松下 春奈(香川大) / 吉岡 大三郎(崇城大) / 小林 匠(横浜国大) / 石田 開(神奈川県立産業技術総研) / 中村 英夫(大阪電気通信大) / 内部 英治(ATR) / 西田 知史(NICT)
幹事氏名(英) Haruna Matsushita(Kagawa Univ.) / Daizaburo Yoshioka(Sojo Univ.) / Takumi Kobayashi(Yokohama National Univ.) / Kai Ishida(KISTEC) / Hideo Nakamura(Osaka Electro-Communication Univ) / Eiji Uchibe(ATR) / Satoshi Nishida(NICT)
幹事補佐氏名(和) 加藤 秀行(大分大) / 横井 裕一(長崎大) / 伊藤 孝弘(広島市立大) / 高林 健人(岡山県立大) / 西川 拓也(国立循環器病研究センター) / 赤澤 淳(明治国際医療大学) / 湯田 恵美(東北大) / 我妻 伸彦(東邦大) / 栗川 知己(関西医科大)
幹事補佐氏名(英) Hideyuki Kato(Oita Univ.) / Yuichi Yokoi(Nagasaki Univ.) / Takahiro Ito(Hiroshima City Univ) / Kento Takabayashi(Okayama Pref. Univ.) / Takuya Nishikawa(National Cerebral and Cardiovascular Center Hospital) / Jun Akazawa(Meiji Univ. of Integrative Medicine) / Emi Yuda(Tohoku Univ) / Nobuhiko Wagatsuma(Toho Univ.) / Tomoki Kurikawa(KMU)

講演論文情報詳細
申込み研究会 Technical Committee on Nonlinear Problems / Technical Committee on Healthcare and Medical Information Communication Technology / Technical Committee on ME and Bio Cybernetics / Technical Committee on Neurocomputing
本文の言語 JPN
タイトル(和) e(m)-PCAを用いた2クラス分類に向けて
サブタイトル(和)
タイトル(英) Towards 2-class classification via e(m)-PCA
サブタイトル(和)
キーワード(1)(和/英) 情報幾何 / information geometry
キーワード(2)(和/英) Kullback?Leibler ダイバージェンス / Kullback?Leibler divergence
キーワード(3)(和/英) 主成分分析 / principal component analysis
キーワード(4)(和/英) 判別分析 / discriminant analysis
第 1 著者 氏名(和/英) 藤木 淳 / Jun Fujiki
第 1 著者 所属(和/英) 福岡大学(略称:福岡大)
Fukuoka University(略称:Fukuoka Univ.)
第 2 著者 氏名(和/英) 赤穂 昭太郎 / Shotaro Akaho
第 2 著者 所属(和/英) 産業技術総合研究所(略称:産総研)
National Institute of Advanced Industrial Science and Technology(略称:AIST)
発表年月日 2022-01-23
資料番号 NC2021-43
巻番号(vol) vol.121
号番号(no) NC-338
ページ範囲 pp.55-58(NC),
ページ数 4
発行日 2022-01-14 (NC)