講演名 2003/7/30
高信頼HPCクラスタのためのチェックポインティング高速化の検討(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(DC-1高信頼化手法)
林田 卓朗, 近藤 正章, 今井 雅, 中村 宏, 南谷 崇, 堀 敦史,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) クラスタシステムは,その高いコストパフォーマンスから近年広く活用されているが,大規模なクラスタシステムでは構成要素となる商用既製品の数が多く,システムの故障率も大きくなる.しかしこれまでは大規模クラスタシステムの信頼性についてはさほど考慮されていなかった.長時間に及ぶ大規模科学技術計算においてクラスタシステムを活用するためには,システムソフトウェアによりシステムの信頼性を向上することが必要不可欠となっている.そこで本稿では高信頼HPCクラスタシステムに適したチェックポインティング機構として階層化チェックポインティングを提案し,初期的な実験を行ったので報告する.SCoreクラスタシステムはチェックポインティング機能を備える公開された高性能並列プログラミング環境であり,今回の実験はSCoreクラスタのチェックポインティング機構を改良することにより行った.
抄録(英) Cluster systems are getting widely used because of good performance / cost ratio. However, little attention has been paid for their reliability so far. As the number of commodity components in a cluster system gets increased, it is indispensable to support reliability by system software. We propose a hierarchical checkpointing in this paper. We explain its mechanism and show preliminary experimantal results. In the experiment, the proposed mechanism is prototyped by modifying SCore cluster system, which is a parallel programming environment with checkpoint mechanism and is open to public.
キーワード(和) チェックポインティング / SCoreクラスタシステム / ディペンダブルシステム
キーワード(英) checkpointing / SCore Cluster System Software / Dependable system
資料番号 DC2003-11
発行日

研究会情報
研究会 DC
開催期間 2003/7/30(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Dependable Computing (DC)
本文の言語 JPN
タイトル(和) 高信頼HPCクラスタのためのチェックポインティング高速化の検討(2003年並列/分散/協調処理に関する「松江」サマーワークショップ(SWoPP松江2003))(DC-1高信頼化手法)
サブタイトル(和)
タイトル(英) Consideration about Fast Checkpointing Mechanism for High-reliable HPC Cluster System
サブタイトル(和)
キーワード(1)(和/英) チェックポインティング / checkpointing
キーワード(2)(和/英) SCoreクラスタシステム / SCore Cluster System Software
キーワード(3)(和/英) ディペンダブルシステム / Dependable system
第 1 著者 氏名(和/英) 林田 卓朗 / Takuro HAYASHIDA
第 1 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology. The University of Tokyo
第 2 著者 氏名(和/英) 近藤 正章 / Masaaki KONDO
第 2 著者 所属(和/英) 科学技術振興事業団:東京大学先端科学技術研究センター
JST:Research Center for Advanced Science and Technology. The University of Tokyo
第 3 著者 氏名(和/英) 今井 雅 / Masashi IMAI
第 3 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology. The University of Tokyo
第 4 著者 氏名(和/英) 中村 宏 / Hiroshi NAKAMURA
第 4 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology. The University of Tokyo
第 5 著者 氏名(和/英) 南谷 崇 / Takashi NANYA
第 5 著者 所属(和/英) 東京大学先端科学技術研究センター
Research Center for Advanced Science and Technology. The University of Tokyo
第 6 著者 氏名(和/英) 堀 敦史 / Atsushi HORI
第 6 著者 所属(和/英) スイミー・ソフトウェア株式会社
Swimmy Software, Inc.
発表年月日 2003/7/30
資料番号 DC2003-11
巻番号(vol) vol.103
号番号(no) 250
ページ範囲 pp.-
ページ数 6
発行日