講演名 2002/7/19
制約付き混合主成分分析によるクラスタリング
吉岡 琢, 石井 信,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 時系列データに対するクラスタ解析では,スケールにかかわらず,似た波形を持つデータが一つのクラスタに所属することが望まれる場合がある.本稿では,時系列データに対してそのようなクラスタリングを行うために,制約付き混合主成分分析(mixture of constrained probabilistic PCA, MCPCA)に基づく手法を提案する.提案手法では,波形が似ているデータはそのスケールにかかわらず同じクラスタに所属するとみなされる.一方で,スケールの小さいデータ(ノイズ成分が相対的に多く含まれていると考えられる)に対してロバストなクラスタリングが可能である.我々は,提案手法を遺伝子発現時系列パターンに対して適用した.結果として,統計的基準にしたがい生物学的に妥当なクラスタ数が得られた.さらに,クラスタリング結果のアンサンブルをとることによって,安定したクラスタ解析を実現できた,提案手法によって生物学的に意味のある時系列パターンを抽出することができた.
抄録(英) In a cluster analysis of time-series data, it is often required that data with similar patterns should be classified into the same cluster regardless of their magnitude (scale). In this article, we propose a clustering method for time-series data based on mixture of constrained PCAs (MCPCA). The proposed method is scale-insensitive, while keeping the robustness to noise possibly involved in expression patterns with a small magnitude. The proposed method was applied to a time-series gene expression data set. As a result, an appropriate number of clusters was determined based on a statistical criterion. Furthermore, by combining clustering results, robustness of the cluster analysis was achieved. Our method was able to caught biologically-meaningful expression patterns.
キーワード(和) クラスタリング / 混合主成分分析 / 時系列データ / 変分ベイズ法 / バイオインフォマテイクス
キーワード(英) clustering / mixture of probabilistic PCA / time-series data / variational Bayes / bioinformatics
資料番号 NC2002-37
発行日

研究会情報
研究会 NC
開催期間 2002/7/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Neurocomputing (NC)
本文の言語 JPN
タイトル(和) 制約付き混合主成分分析によるクラスタリング
サブタイトル(和)
タイトル(英) Clustering using mixture of constrained probabilistic PCA models
サブタイトル(和)
キーワード(1)(和/英) クラスタリング / clustering
キーワード(2)(和/英) 混合主成分分析 / mixture of probabilistic PCA
キーワード(3)(和/英) 時系列データ / time-series data
キーワード(4)(和/英) 変分ベイズ法 / variational Bayes
キーワード(5)(和/英) バイオインフォマテイクス / bioinformatics
第 1 著者 氏名(和/英) 吉岡 琢 / Taku YOSHIOKA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science
第 2 著者 氏名(和/英) 石井 信 / Shin ISHII
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Nara Institute of Science and Technology
発表年月日 2002/7/19
資料番号 NC2002-37
巻番号(vol) vol.102
号番号(no) 253
ページ範囲 pp.-
ページ数 6
発行日