講演名 2006-11-16
サンプルフロー統計から元のトラヒッタパターンを推定する方法(インターネットの品質評価・品質管理技術,ネットワーク品質,トラヒック計測,一般)
森 達哉, 川原 亮一, 上山 憲昭, 石橋 圭介, 原田 薫明,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) パケットサンプリング技術は,フロー統計をスケーラブルに計測する技術として欠かせないものになってきている.実際,今日のISPの多くはサンプルフロー統計をベースにネットワークを監視している.ところで,近年の研究によればフロー統計からトラヒッタパターンを分析することによって,ネットワークに生じる異常を検出できることが明らかになっている.たとえばサイズの小さなフローの数が急激に増加したら,それは大規模なワームの発生に関連している可能性がある.しかしながらパケットサンプリングから得られるフロー統計を分析する場合,そのようなパターンを正しく捉えられない可能性がある.なぜならサンプリングによって小さなフローの大多数がサンプルされないからである.本研究では,実計測データを用いサンプリングによって元のフロー統計がどの程度情報を失うかを示す.つぎに不完全データに対する最尤推定方法であるEMアルゴリズムを用いても,元のフロー統計を正しく推定できないことを実験例を用いて示す.最後に元のフロー統計に関する追加の情報(非サンプルプロー数)を導入することによって,元のフロー統計の推定精度が著しく向上し,結果としてサンプルプロー統計から元のトラヒックパターンの変化を捉えることが出来ることを示す.
抄録(英) Packet sampling has become a practical and indispensable means to measure flow statistics. Nowadays, most of major ISPs are monitoring their networks based on the sampled flow statistics collected at main routers. Recent studies have demonstrated that analyzing traffic patterns is crucial in detecting network anomalies. For example, sharp increase in the number of small flows may be related to an anomalous event such as worm outbreak. We may not be able to infer the original traffic patterns correctly from the sampled flow statistics because sampling process wipes out a lot of information about small flows, which play a vital role in determining the characteristics of traffic patterns. In this paper, we first show an example of how the sampling process wipes out the original statistics using measured data. Then, we show empirical examples indicating that the original traffic pattern cannot be inferred correctly even if we use a statistical inference method for incomplete data, i.e., the EM algorithm, for sampled flow statistics. Finally, we show that additional information about the original flow statistics, the number of unsampled flows, is helpful in tracking the change in original traffic patterns using sampled flow statistics.
キーワード(和) 計測 / フロー / サンプリング / エントロピー / EMアルゴリズム
キーワード(英) measurement / flow / sampling / entropy / EM algorithm
資料番号 NS2006-125,CQ2006-66,TM2006-39
発行日

研究会情報
研究会 CQ
開催期間 2006/11/9(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Communication Quality (CQ)
本文の言語 ENG
タイトル(和) サンプルフロー統計から元のトラヒッタパターンを推定する方法(インターネットの品質評価・品質管理技術,ネットワーク品質,トラヒック計測,一般)
サブタイトル(和)
タイトル(英) Inferring original traffic pattern from sampled flow statistics
サブタイトル(和)
キーワード(1)(和/英) 計測 / measurement
キーワード(2)(和/英) フロー / flow
キーワード(3)(和/英) サンプリング / sampling
キーワード(4)(和/英) エントロピー / entropy
キーワード(5)(和/英) EMアルゴリズム / EM algorithm
第 1 著者 氏名(和/英) 森 達哉 / Tatsuya MORI
第 1 著者 所属(和/英) NTTサービスインテグレーション基盤研究所:国立情報学研究所
NTT Service Integration Laboratories:National Institute of Informatics
第 2 著者 氏名(和/英) 川原 亮一 / Ryoichi KAWAHARA
第 2 著者 所属(和/英) NTTサービスインテグレーション基盤研究所:国立情報学研究所
NTT Service Integration Laboratories:National Institute of Informatics
第 3 著者 氏名(和/英) 上山 憲昭 / Noriaki KAMIYAMA
第 3 著者 所属(和/英) NTTサービスインテグレーション基盤研究所:国立情報学研究所
NTT Service Integration Laboratories:National Institute of Informatics
第 4 著者 氏名(和/英) 石橋 圭介 / Keisuke ISHIBASHI
第 4 著者 所属(和/英) NTT情報流通プラットフォーム研究所
NTT Information Sharing Platform Laboratories
第 5 著者 氏名(和/英) 原田 薫明 / Shigeaki HARADA
第 5 著者 所属(和/英) NTTサービスインテグレーション基盤研究所:国立情報学研究所
NTT Service Integration Laboratories:National Institute of Informatics
発表年月日 2006-11-16
資料番号 NS2006-125,CQ2006-66,TM2006-39
巻番号(vol) vol.106
号番号(no) 356
ページ範囲 pp.-
ページ数 6
発行日