講演名 | 2002/7/19 制約付き混合主成分分析によるクラスタリング 吉岡 琢, 石井 信, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 時系列データに対するクラスタ解析では,スケールにかかわらず,似た波形を持つデータが一つのクラスタに所属することが望まれる場合がある.本稿では,時系列データに対してそのようなクラスタリングを行うために,制約付き混合主成分分析(mixture of constrained probabilistic PCA, MCPCA)に基づく手法を提案する.提案手法では,波形が似ているデータはそのスケールにかかわらず同じクラスタに所属するとみなされる.一方で,スケールの小さいデータ(ノイズ成分が相対的に多く含まれていると考えられる)に対してロバストなクラスタリングが可能である.我々は,提案手法を遺伝子発現時系列パターンに対して適用した.結果として,統計的基準にしたがい生物学的に妥当なクラスタ数が得られた.さらに,クラスタリング結果のアンサンブルをとることによって,安定したクラスタ解析を実現できた,提案手法によって生物学的に意味のある時系列パターンを抽出することができた. |
抄録(英) | In a cluster analysis of time-series data, it is often required that data with similar patterns should be classified into the same cluster regardless of their magnitude (scale). In this article, we propose a clustering method for time-series data based on mixture of constrained PCAs (MCPCA). The proposed method is scale-insensitive, while keeping the robustness to noise possibly involved in expression patterns with a small magnitude. The proposed method was applied to a time-series gene expression data set. As a result, an appropriate number of clusters was determined based on a statistical criterion. Furthermore, by combining clustering results, robustness of the cluster analysis was achieved. Our method was able to caught biologically-meaningful expression patterns. |
キーワード(和) | クラスタリング / 混合主成分分析 / 時系列データ / 変分ベイズ法 / バイオインフォマテイクス |
キーワード(英) | clustering / mixture of probabilistic PCA / time-series data / variational Bayes / bioinformatics |
資料番号 | NC2002-37 |
発行日 |
研究会情報 | |
研究会 | NC |
---|---|
開催期間 | 2002/7/19(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Neurocomputing (NC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 制約付き混合主成分分析によるクラスタリング |
サブタイトル(和) | |
タイトル(英) | Clustering using mixture of constrained probabilistic PCA models |
サブタイトル(和) | |
キーワード(1)(和/英) | クラスタリング / clustering |
キーワード(2)(和/英) | 混合主成分分析 / mixture of probabilistic PCA |
キーワード(3)(和/英) | 時系列データ / time-series data |
キーワード(4)(和/英) | 変分ベイズ法 / variational Bayes |
キーワード(5)(和/英) | バイオインフォマテイクス / bioinformatics |
第 1 著者 氏名(和/英) | 吉岡 琢 / Taku YOSHIOKA |
第 1 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Graduate School of Information Science |
第 2 著者 氏名(和/英) | 石井 信 / Shin ISHII |
第 2 著者 所属(和/英) | 奈良先端科学技術大学院大学情報科学研究科 Nara Institute of Science and Technology |
発表年月日 | 2002/7/19 |
資料番号 | NC2002-37 |
巻番号(vol) | vol.102 |
号番号(no) | 253 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |