講演抄録/キーワード |
講演名 |
2017-03-13 16:40
ファジィ推論をキーワード及びその種類数に適用して得られる特徴を用いた悪性PDF検知法 ○加藤広野・春田秀一郎・笹瀬 巌(慶大) ICSS2016-54 |
抄録 |
(和) |
近年,PDF (Portable Document Format) に悪意のあるJavaScriptのコードなどを組み込んだ悪性PDFが横行し,その検知が急務である.その検知法として悪性と良性の間でキーワードと呼ばれる内部構成要素の出現頻度の差異に着目した方式がある.この方式では学習データセット内のファイルに頻繁に含まれるキーワードの出現頻度を特徴として利用する.しかし,特徴として考慮されないキーワードのうち,悪性PDFの検知に有用な特徴となりうるものが存在する場合,そのようなキーワードを多く持つ悪性PDFを検知できない.そこで本論文では,従来方式において,特徴となるキーワードの多くは良性と悪性の両方に出現すると考え,悪性PDFと良性PDFに出現するキーワードの種類数の差分$c_sub$とファイルに出現する全キーワードの種類数$n_keyword$に着目することで,従来方式で考慮されなかったキーワードを考慮することを可能とし,さらに,この2つの特徴を個別の特徴として利用した場合,悪性PDFの検知性能が低減しうるため,2つの特徴にファジィ推論を適用して得られるスコアを特徴とすることで対処し,この特徴を従来方式の特徴と共に用いて悪性PDFを検知する方法を提案する.特性評価を行うために必要なパラメータを実験によって決定し,実データセットを用いた特性評価を行うことで,偽陽性および偽陰性を共に低減可能であることを示す. |
(英) |
Detecting malicious PDFs (Portable Document Format) is imperative. In several malicious PDF detection schemes, the scheme that focuses on the difference of internal components called "keyword" among malicious and legitimate is gathering attention. That scheme uses the number of occurrence of the keywords that appear frequently in files of the training dataset as features. However, since keywords which are not adopted as features are ignored, it might miss the useful keywords.
In this paper, we propose Malicious PDF Detection Scheme using Keywords Feature based on Fuzzy inference. By computer simulation with real dataset, we demonstrate our scheme can reduce both false positive and false negative. |
キーワード |
(和) |
PDF / 機械学習 / ファジィ推論 / JavaScript / / / / |
(英) |
PDF / Machine Learning / Fuzzy Inference / JavaScript / / / / |
文献情報 |
信学技報, vol. 116, no. 522, ICSS2016-54, pp. 85-90, 2017年3月. |
資料番号 |
ICSS2016-54 |
発行日 |
2017-03-06 (ICSS) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICSS2016-54 |