講演抄録/キーワード |
講演名 |
2018-11-21 15:15
ラベル情報を利用する敵対的生成モデルによるマルウェア解析手法の検討 ○古本啓祐・伊沢亮一・高橋健志・井上大介(NICT) ICSS2018-57 |
抄録 |
(和) |
マルウェアを画像化する手法と深層学習を組み合わせた方式が数多く提案されている.これらの手法は,従来の人手による解析作業とは異なり,統計的な最適化問題として各検体を扱うアプローチであると考えられる.マルウェアのデータセットには,各検体に対する正解ラベル(マルウェアファミリ)の命名規則や判断基準がセキュリティベンダーごとに異なっており,識別精度がラベル付けの方法に大きく影響を受けるという課題が存在する.そこで,敵対的生成モデル(GAN:Generative Adversarial Networks)をマルウェア解析に適用するアプローチを検討する.GANのモデルは,複製側(Generator)と識別側(Discriminator)の2つのニューラルネットワークを内包し競わせることにより,教師なし学習による特徴量の学習結果を具体的なデータ表現として扱えることが可能である.特に本稿では,Conditional GANと呼ばれるラベル情報を利用することで出力クラスを明示的に指定可能なモデルを利用した手法を提案する.大規模データセットにおいて正解ラベルを各検体に1対1に対応付ける必要がなく,複数のセキュリティベンダーによるラベル情報をモデル内で利用できることが提案手法の特徴である. |
(英) |
Many schemes combining deep learning with methods for imaging malware have been proposed. These methods are considered to be statistical optimization problems unlike conventional manual analysis work. In the data set of malware, the naming rules and criteria of the correct label (malware family) are different for each security vendor, and there is a problem that the identification accuracy is greatly affected by the labeling method. Therefore, we consider approaches to apply Generative Adversarial Networks to malware analysis. In the GAN model, it is possible to learn feature quantities by unsupervised learning. In particular, this paper proposes a method using a model called Conditional GAN. The feature of the proposed method is that it is not necessary to associate correct labels with each specimen in a large-scale dataset, and label information from multiple security vendors can be used in the model. |
キーワード |
(和) |
マルウェア / ディープラーニング / 敵対的生成学習 / / / / / |
(英) |
Malware / Deep Learning / Generative Adversarial Networks / / / / / |
文献情報 |
信学技報, vol. 118, no. 315, ICSS2018-57, pp. 25-30, 2018年11月. |
資料番号 |
ICSS2018-57 |
発行日 |
2018-11-14 (ICSS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICSS2018-57 |