講演名 2006/7/25
書き換え可能性を利用した耐故障性の改善について(アーキテクチャ,SWoPP2006)
川合 浩之, 山口 佳樹, 安永 守利,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) システムを構成する集積回路について考えた場合,この部分の損傷は他の部分以上に致命的な影響を与えることが多い.このためシステムの信頼性向上では集積回路の耐故障性向上が重要であり,ソフトウェアのエラーだけでなく,ハードウェア的な損傷についても議論を行う必要がある.そこで本論文では,ディペンダブルコンピューティングを意識した,受動的な耐故障性の向上(モジュールの多重化と多数決によるエラーの低減)と能動的な耐故障性の向上(損傷モジュールの切り離しと正常動作する回路の動的な生成)を組合わせたタイルフォールトトレラント手法について提案する.集積回路システムに誤動作・故障を引き起こす主な原因の一つとしては,宇宙線・太陽風及びα線などの放射線による影響が広く知られている.この放射線に影響に対する研究結果は数多く発表され現在までに多くの成果をもたらしている.しかし一方で,全ての放射線から集積回路システムを守るのは非常に難しく,また特殊環境下における面積単価は非常に高いため,冗長化構造による受動的な耐故障性の向上にも限界があることが知られている.そこで,タイルフォールトトレラント手法では能動的な耐故障性向上手法を取り入れることで,以上の改善を図っている.具体的には,FPGAの構造を考慮した,タイルと呼ばれる細かいユニットを基本単位とした回路再構成を用いることで故障部分の修復を行なうことである.また,本提案手法のもう一つの特徴として,スペアを予め用意するのではなく故障した段階で正常な回路を能動的に複製することにより,システムの冗長性及び面積使用効率などを従来手法より高めている点を挙げることができる.本システムでは,回路再構成機能を用いることで使用面積に対する効率の向上を図っており,本論文ではこれを実現するタイルフォールトトレラント手法の詳細とその結果について報告を行なう.
抄録(英) In space, galactic cosmic rays and solar rays collide with integrated circuits. It causes a breakdown of LSI, namely a hardware failure. Due to the increasing requirements of spacecraft applications, it is important that radiation fault-tolerant techniques are improved. This paper describes an approach which realizes a dependable computing system using a reconfigurable device. Firstly, we decide a logical block, namely a "tile". A single tile is composed of several processing elements, such as Look Up Tables. A module is composed of several tiles. When a module does not work well for a hardware failure, circuits on a bad tile which has the hardware failure are reconfigured to a fine tile. In this approach, secondly, the size of a single tile is important. We can reduce void circuits when the size is very small. But, we must continually check whether all tiles are fine or not, and the computing cost will be very large. The approach requires the proper size of a single tile which a module is composed of so that efficiency and effectiveness with the system is in real use. Our experimental results show that our proposed approach can produce a prototype hardware system that is smaller when compared with a simple fault-tolerant implementation such as triple module redundancy. It is clear that our approach can implement larger circuits than current ones using the same device.
キーワード(和)
キーワード(英)
資料番号 DC2006-22
発行日

研究会情報
研究会 DC
開催期間 2006/7/25(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Dependable Computing (DC)
本文の言語 JPN
タイトル(和) 書き換え可能性を利用した耐故障性の改善について(アーキテクチャ,SWoPP2006)
サブタイトル(和)
タイトル(英) Improvement of Module Redundancy using FPGAs
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 川合 浩之 / Hiroyuki KAWAI
第 1 著者 所属(和/英) 筑波大学大学院システム情報工学研究科
Dept. of Computer Science, Graduate School of Systems and Information Engineering, Univ. of Tsukuba
第 2 著者 氏名(和/英) 山口 佳樹 / Yoshiki YAMAGUCHI
第 2 著者 所属(和/英) 筑波大学大学院システム情報工学研究科
Dept. of Computer Science, Graduate School of Systems and Information Engineering, Univ. of Tsukuba
第 3 著者 氏名(和/英) 安永 守利 / Moritoshi YASUNAGA
第 3 著者 所属(和/英) 筑波大学大学院システム情報工学研究科
Dept. of Computer Science, Graduate School of Systems and Information Engineering, Univ. of Tsukuba
発表年月日 2006/7/25
資料番号 DC2006-22
巻番号(vol) vol.106
号番号(no) 198
ページ範囲 pp.-
ページ数 6
発行日