講演抄録/キーワード |
講演名 |
2009-07-09 15:15
[奨励講演]大規模システム向け障害分析を可能にする最尤分析の拡張 ○登内敏夫(NEC) ICM2009-16 |
抄録 |
(和) |
分散システムでは,ひとつの障害から複数の障害へと派生,多数のイベントが発生するため,障害原意の特定が困難である.過去のイベントログから最尤分析を行うことで,障害の派生パターンを学習,それをもとに根本障害を分析する技術の研究を行ってきた.しかし,その方法では,管理システムを構成するコンポーネント数の二乗に比例して学習時間及び分析時間が増加するため,大規模システムに適用することが困難であった.本稿では,コンポーネント間の障害派生関係と,障害種別ごとの障害派生関係は確率的に独立と仮定することで,学習時間,障害分析時間ともに低減させるアルゴリズムを提案する.これにより,障害派生パターンの学習及びパターンを用いた障害分析はコンポーネント数に対して定数オーダで計算が可能であることを示す. |
(英) |
We proposed, in previous paper, a new root cause analysis method in which fault propagation models are calculated with maximum likelihood analysis. In this method, however, learning of fault propagation patterns and analysis with the propagation model takes time with O(N2) where N is product of the number of components and faults. We propose, in this paper, a new maximum likelihood analysis algorithm. The algorithm assumes the probability of fault propagation among types of fault components and that of fault propagation among components are independent. In the proposed algorithm, the learning phase and the analysis phase take O(1) times.. |
キーワード |
(和) |
障害分析 / 派生障害 / イベントコリレーション / 最尤分析 / 隠れマルコフモデル / / / |
(英) |
Fault Analysis / Derived Faillure / Event Correlation / Likelihood Analysis / Hidden Markov Model / / / |
文献情報 |
信学技報, vol. 109, no. 120, ICM2009-16, pp. 19-24, 2009年7月. |
資料番号 |
ICM2009-16 |
発行日 |
2009-07-02 (ICM) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICM2009-16 |