講演抄録/キーワード |
講演名 |
2005-10-17 13:15
有限なロールバック間隔に対するハイブリッド状態保存手法の最適チェックポイント間隔 ○大原 衛(都立大)・新井雅之・福本 聡・岩崎一彦(首都大東京) |
抄録 |
(和) |
本稿では,限られた計算資源を用いて動作する実際的なアプリケーションにおける,非連携チェックポインティングの総期待オーバヘッドについて議論する.具体的には,各プロセスが保持できるチェックポイント数に制限があり,ロールバック間隔に上限がある場合の,ハイブリッド状態保存手法の総期待オーバヘッドを評価する離散時間確率モデルを構築し,これを最小化する最適チェックポイント間隔を導出する.本稿の評価モデルは,ロールバック間隔を確率変数とし,その分布に片側の切れた幾何分布を仮定する.最適チェックポイント間隔を陽に導出するのは難しいが,より単純な確率分布を用いて,最適チェックポイント間隔が近似的に与えられる.シミュレーションによる数値例から,この近似が良好であることや,本稿の評価モデルが従来の確率モデルに比べてより適切なチェックポイント間隔を与えることが示される. |
(英) |
This paper discusses distributed periodic checkpointing for practical applications running with limited resources. We present a discrete time model evaluating the total expected overhead imposed on every event execution where the number of available checkpoints that each process can hold is finite and the rollback distance is bound to some finite interval. The recovery overhead for the checkpointing scheme is described by using a truncated geometric distribution as the rollback distance distribution. Although it is difficult to analytically derive the optimal checkpoint interval, which minimizes the total expected overhead, substituting other simple probabilistic distributions instead of the truncated geometric distribution enables us to do this explicitly. Numerical examples obtained through simulations are presented to show that we can achieve almost the minimized total overhead by using the new models and analyses. |
キーワード |
(和) |
信頼性 / 分散システム / 非連携チェックポインティング / 確率モデル / 台形分布 / / / |
(英) |
reliability / distributed systems / uncoordinated checkpointing / probability models / trapezoidal distribution / / / |
文献情報 |
信学技報, vol. 105, no. 339, DC2005-21, pp. 13-18, 2005年10月. |
資料番号 |
DC2005-21 |
発行日 |
2005-10-10 (DE, DC) |
ISSN |
Print edition: ISSN 0913-5685 |
PDFダウンロード |
|
|