講演名 2020-02-27
NDCKPT: 不揮発性メインメモリを用いたOSによる透過的なプロセスチェックポインティングの実現
西田 耀(早大), 木村 啓二(早大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) アプリケーションの耐障害性を向上させる手法の一つにチェックポインティングがある.これまでに,アプリケーションを変更することなく透過的にチェックポイントを行う手法がいくつか発表されている.また,Non-volatile DIMM (NVDIMM)を状態の保存先として利用することで,主記憶に比べて100倍以上遅い外部記憶へのアクセスに依存することなくチェックポイントを行う手法が提案されている.しかし,DRAMで構成された主記憶から不揮発性の記憶装置に状態をコピーするという操作は依然存在しており,これがチェックポイントのオーバーヘッドの大部分を占めている.本研究では,アプリケーションをNVDIMM上に直接マッピングして実行することで状態のコピーを最小限に抑え,さらにページテーブルも含めたプロセスのメモリ空間を二重化して一貫性を確保しつつチェックポインティングを行う,NDCKPTという手法を提案する.Linux KernelにNDCKPTを実装し,Optane DC Persistent Memoryを用いて評価を行った結果,メモリ消費量が1MB程度のアプリケーションでは,100ms程度の高頻度でチェックポイントを行っても実行時間の増加を1%以下に抑えられることがわかった.また,数百MBのメモリを消費するアプリケーションにおいては,NVDIMM上で実行を行うオーバーヘッドが支配的で実行時間比で2倍から3倍以上となる一方,チェックポイントによって加わるオーバーヘッドは20-30秒間隔で10%前後となることがわかった.
抄録(英) Checkpointing is a technique to give a fault tolerance to applications. Some research proposed ways to checkpoint arbitrary unmodified applications transparently. Previous study shows that Non-volatile DIMM(NVDIMM) can be used for storing checkpoint states to avoid depending on external non-volatile storages which is hundreds times slower than DRAM. However, every checkpoint techniques still copy process states from DRAM to non-volatile storages and it is a major bottleneck. This paper proposes NDCKPT, which maps applications into NVDIMM directly to reduce copying on checkpointing, and duplicate memory space and page table structure to ensure consistency of checkpointing. We implemented NDCKPT on Linux kernel and evaluated with Optane DC Persistent Memory. We found NDCKPT overhead for small applications which consume approximate 1MB memory can be less than 1% even the checkpoint frequency is 100 ms. For large applications which use hundreds megabytes of memory, the slowdown comes from execution on NVDIMM is dominant, and the execution time can be 2 to 3 times longer than on DRAM. However, additional slowdown by checkpoints with 20 to 30 seconds interval is around 10% of time on NVDIMM without checkpoints.
キーワード(和) 不揮発性メモリ / チェックポインティング / オペレーティングシステム
キーワード(英) Non-volatile DIMM / Checkpointing / Operating System
資料番号 CPSY2019-102,DC2019-108
発行日 2020-02-20 (CPSY, DC)

研究会情報
研究会 CPSY / DC / IPSJ-SLDM / IPSJ-EMB / IPSJ-ARC
開催期間 2020/2/27(から2日開催)
開催地(和) 与論町中央公民館
開催地(英) Yoron-cho Chuou-Kouminkan
テーマ(和) 組込み技術とネットワークに関するワークショップ ETNET2020
テーマ(英) ETNET 2020
委員長氏名(和) 入江 英嗣(東大) / 福本 聡(首都大東京) / 田宮 豊(富士通研) / / 井上 弘士(九大)
委員長氏名(英) Hidetsugu Irie(Univ. of Tokyo) / Satoshi Fukumoto(Tokyo Metropolitan Univ.) / Yutaka Tamiya(Fujitsu Lab.) / / Hiroshi Inoue(Kyushu Univ.)
副委員長氏名(和) 鯉渕 道紘(NII) / 中島 耕太(富士通研) / 高橋 寛(愛媛大)
副委員長氏名(英) Michihiro Koibuchi(NII) / Kota Nakajima(Fujitsu Lab.) / Hiroshi Takahashi(Ehime Univ.)
幹事氏名(和) 津邑 公暁(名工大) / 高前田 伸也(東大) / 新井 雅之(日大) / 難波 一輝(千葉大) / 土谷 亮(滋賀県大) / 岩崎 裕江(NTT) / 佐々木 通(三菱電機) / / 近藤 正章(東大) / 塩谷 亮太(東大) / 田中 美帆(富士通研) / 長谷川 揚平(キオクシア)
幹事氏名(英) Tomoaki Tsumura(Nagoya Inst. of Tech.) / Shinya Takameda(Univ. of Tokyo) / Masayuki Arai(Nihon Univ.) / Kazuteru Namba(Chiba Univ.) / Akira Tsuchiya(Univ. Shiga Prefecture) / Hiroe Iwasaki(NTT) / Toru Sasaki(Mitsubishi Electric) / / Masaaki Kondo(Univ. of Tokyo) / Ryota Shioya(Univ. of Tokyo) / Miho Tanaka(Fujitsu Labs.) / Yohei Hasegawa(KIOXIA)
幹事補佐氏名(和) 有間 英志(東大) / 小川 周吾(日立)
幹事補佐氏名(英) Eiji Arima(Univ. of Tokyo) / Shugo Ogawa(Hitachi)

講演論文情報詳細
申込み研究会 Technical Committee on Computer Systems / Technical Committee on Dependable Computing / Special Interest Group on System and LSI Design Methodology / Special Interest Group on Embedded Systems / Special Interest Group on System Architecture
本文の言語 JPN
タイトル(和) NDCKPT: 不揮発性メインメモリを用いたOSによる透過的なプロセスチェックポインティングの実現
サブタイトル(和)
タイトル(英) NDCKPT: Transparent Checkpointing on NVDIMM with Operating System Support
サブタイトル(和)
キーワード(1)(和/英) 不揮発性メモリ / Non-volatile DIMM
キーワード(2)(和/英) チェックポインティング / Checkpointing
キーワード(3)(和/英) オペレーティングシステム / Operating System
第 1 著者 氏名(和/英) 西田 耀 / Hikaru Nishida
第 1 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 2 著者 氏名(和/英) 木村 啓二 / Keiji Kimura
第 2 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
発表年月日 2020-02-27
資料番号 CPSY2019-102,DC2019-108
巻番号(vol) vol.119
号番号(no) CPSY-428,DC-429
ページ範囲 pp.87-92(CPSY), pp.87-92(DC),
ページ数 6
発行日 2020-02-20 (CPSY, DC)