講演抄録/キーワード |
講演名 |
2012-11-22 13:15
マルウェアのバイナリを用いた機械学習によるパッカの特定手法の提案 ○伊沢亮一・班 涛・井上大介(NICT) ICSS2012-48 |
抄録 |
(和) |
パッカ特定にはPEiDと呼ばれるシグネチャベースのツールが利用されることが多い.対象のファイルにシグネチャが含まれるかを完全一致で検査するため,シグネチャに1バイトでも誤りがあるとパッカを特定することができない.これに起因して,誤りが含まれないようにするために長いシグネチャを作成することが難しく,偽陽性率(False Positive 率)が高いことが問題となっている.本稿では,PEiDの課題を改善するという立場で,String-Kernel-Based SVM を用いたパッカ特定手法を提案する.学習データにはPEiDのシグネチャと同様にパックされたファイルのバイト列を用いるが,SVMには完全一致のような制約がないため,より長いバイト列をパッカの特定に利用できる.評価実験では,5 クラス問題においてAccuracyが99.84%でパッカの特定が可能であることを示す.提案手法はマルウェアに施されているパッカの特定に利用し,マルウェアの解析に役立てることを目的としている. |
(英) |
PEiD is a well-known packer identication tool. However, it often fails to identify a packer name of the target le because PEiD applies the exact match to check what packer is used. If a signature, which is a byte sequence of a packer le, has just 1 byte error, the exact match cannot identify the packer name. It occurs another disadvantage. That is, you should make a short signature to ensure that the signature has no error. The shorter the length of the signature is, the more false positive rate PEiD has. In order to overcome the disadvantages of PEiD, we propose a novel packer identication method based on a string-kernel-based SVM. We apply a byte sequence as a training data. Because SVM is no exact match method, we can use a long byte sequence. In the experiment of a classication problem with 5 classes, we show that Accuracy of our method is 99.84%. We intend to solve a packer problem on malware using our scheme. |
キーワード |
(和) |
マルウェア解析 / SVM(Support Vector Machine) / アンパック / アセンブルコード / 分類 / / / |
(英) |
malware analysis / SVM (Support Vector Machine) / unpack / opcode / classification / / / |
文献情報 |
信学技報, vol. 112, no. 315, ICSS2012-48, pp. 19-24, 2012年11月. |
資料番号 |
ICSS2012-48 |
発行日 |
2012-11-15 (ICSS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICSS2012-48 |