講演名 2007/7/26
ローテーショナル・ワンミラー非連携チェックポインティングのリカバラビリティ(分散システム)
上杉 賢弘, 大原 衛, 新井 雅之, 福本 聡,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来のチェックポインティング技術の多くは,ストレージメディアの障害を想定していない.メディアに障害が発生した場合,保存されたチェックポイントデータが失われるため,システムは障害回復を行えなくなる.本稿では,メディア障害に耐性をもつ非連携チェックポインティング手法を提案する.各プロセスはチェックポイントデータを自ノードのストレージメディアに保存し,加えてその複製を他ノードのストレージメディアに配置する.メディア障害が発生した際は,これらの複製を取得することで障害回復を行う.また,本稿では,複製を配置するノードを固定した手法と,チェックポインティングのたびにこれを変更するローテーショナル・ワンミラー(ROM)手法についてシミュレーションによる回復能力の評価をおこなった.数値例から,ROM手法は,メッセージ頻度が低い環境での2重メディア障害発生時に,平均ロールバック間隔を効果的に低減できることが示された.
抄録(英) Most previous checkpointing techniques assume the storage media are stable. The system cannot recover from failure when some failures occur in the media because the checkpoint data are lost. In this paper, we propose a media-failure-tolerant uncoordinated checkpointing technique. In the proposed technique, each process saves its checkpoint data into the media of other nodes in addition to its own medium. When media failure occurs, the failure is recovered by loading these copies. Moreover, we performed simulations to evaluate the recoverability of fixed mirror node techniques and rotational one-mirror (ROM) techniques which changes mirror node every times. The results show the ROM technique can effectively reduce mean rollback distances on double media failures with lower message frequency.
キーワード(和) 非連携チェックポインティング / ワンミラー・チェックポインティング / メディア障害 / リカバラビリティ
キーワード(英) uncoordinated checkpointing / one-mirror checkpointing / media failures / recoverability
資料番号 DC2007-7
発行日

研究会情報
研究会 DC
開催期間 2007/7/26(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Dependable Computing (DC)
本文の言語 JPN
タイトル(和) ローテーショナル・ワンミラー非連携チェックポインティングのリカバラビリティ(分散システム)
サブタイトル(和)
タイトル(英) Recoverability of Rotational One-Mirror Uncoordinated Checkpointing
サブタイトル(和)
キーワード(1)(和/英) 非連携チェックポインティング / uncoordinated checkpointing
キーワード(2)(和/英) ワンミラー・チェックポインティング / one-mirror checkpointing
キーワード(3)(和/英) メディア障害 / media failures
キーワード(4)(和/英) リカバラビリティ / recoverability
第 1 著者 氏名(和/英) 上杉 賢弘 / Takahiro UESUGI
第 1 著者 所属(和/英) 首都大学東京大学院システムデザイン研究科
Graduate School of System Design, Tokyo Metropolitan University
第 2 著者 氏名(和/英) 大原 衛 / Mamoru OHARA
第 2 著者 所属(和/英) 首都大学東京システムデザイン学部
Faculty of System Design, Tokyo Metropolitan University
第 3 著者 氏名(和/英) 新井 雅之 / Masayuki ARAI
第 3 著者 所属(和/英) 首都大学東京システムデザイン学部
Faculty of System Design, Tokyo Metropolitan University
第 4 著者 氏名(和/英) 福本 聡 / Satoshi FUKUMOTO
第 4 著者 所属(和/英) 首都大学東京システムデザイン学部
Faculty of System Design, Tokyo Metropolitan University
発表年月日 2007/7/26
資料番号 DC2007-7
巻番号(vol) vol.107
号番号(no) 174
ページ範囲 pp.-
ページ数 6
発行日