講演名 2014/6/18
エクソーム解析パイプラインの京コンピュータ上での大規模並列化(機械学習によるバイオデータマインニング,一般)
青山 健人, 角田 将典, 松崎 由理, 石田 貴士, 秋山 泰,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,全ゲノム配列のうちタンパク質を翻訳するエクソン領域のみを解析するエクソーム解析が可能となり,がんゲノム研究などに用いられている.また,シーケンシング技術の向上によってゲノム情報の蓄積は増加し続けており,さらに大規模な生命情報解析環境が求められている.本研究では汎用PCクラスター上で動作するエクソーム解析パイプラインソフトウェアGenomon-exomeを理化学研究所のスーパーコンピュータ「京」上に移植し,パイプライン内部の処理についてMPIによるMaster-Workerモデルでタスク分散を行うシステムを実装することで,ジョブ投入数を抑えた大規模な生命情報解析環境を構築した.本報告では,スーパーコンピュータ「京」上に実装したパイプラインの実行性能評価を行った.
抄録(英) Exome analysis, which is a method to analyze only protein coding region, has been used in various research fields such as a cancer genome research. Because of the improvement of a high-speed sequencer, demands of effective sequence analysis on large computational environment have been increased. Genomon-exome is a useful pipeline software for analyzing exome data but executable on only general PC clusters. In this study, We attempted to implement the Genomon-exome on the K-computer using a Master-Worker model task distribution framework implemented MPI. We also evaluated the scalability of the pipeline on K-computer.
キーワード(和) スーパーコンピュータ「京」 / エクソーム解析 / パイプライン / Genomon-exome / MPI
キーワード(英) K-computer / Exome analysis / Pipeline / Genomon-exome / MPI
資料番号 Vol.2014-MPS-98 No.33,Vol.2014-BIO-38 No.33
発行日

研究会情報
研究会 IBISML
開催期間 2014/6/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Information-Based Induction Sciences and Machine Learning (IBISML)
本文の言語 JPN
タイトル(和) エクソーム解析パイプラインの京コンピュータ上での大規模並列化(機械学習によるバイオデータマインニング,一般)
サブタイトル(和)
タイトル(英) Large-scale Parallelization of Exome Analysis Pipeline on K-computer
サブタイトル(和)
キーワード(1)(和/英) スーパーコンピュータ「京」 / K-computer
キーワード(2)(和/英) エクソーム解析 / Exome analysis
キーワード(3)(和/英) パイプライン / Pipeline
キーワード(4)(和/英) Genomon-exome / Genomon-exome
キーワード(5)(和/英) MPI / MPI
第 1 著者 氏名(和/英) 青山 健人 / KENTO AOYAMA
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻:東京工業大学博士課程教育リーディングプログラム情報生命博士教育院
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology:Education Academy of Computational Life Sciences, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 角田 将典 / MASANORI KAKUTA
第 2 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 松崎 由理 / YURI MATSUZAKI
第 3 著者 所属(和/英) 東京工業大学博士課程教育リーディングプログラム情報生命博士教育院
Education Academy of Computational Life Sciences, Tokyo Institute of Technology
第 4 著者 氏名(和/英) 石田 貴士 / TAKASHI ISHIDA
第 4 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology
第 5 著者 氏名(和/英) 秋山 泰 / YUTAKA AKIYAMA
第 5 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻:東京工業大学博士課程教育リーディングプログラム情報生命博士教育院
Department of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology:Education Academy of Computational Life Sciences, Tokyo Institute of Technology
発表年月日 2014/6/18
資料番号 Vol.2014-MPS-98 No.33,Vol.2014-BIO-38 No.33
巻番号(vol) vol.114
号番号(no) 105
ページ範囲 pp.-
ページ数 7
発行日