講演名 2021-03-05
悪性URL検知のためのEmbedding手法と機械学習モデルについての考察
陳 啓晟(筑波大), 面 和成(筑波大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 最近インターネットへのアクセスがますます増えており、悪意あるウェブサイトによる被害が深刻化している。Google Safe Browsingなど,この問題を解決するの多くの解決策は悪意あるウェブサイトを検知する。ブラックリスト方式は悪意あるURLを検出するのに非常に便利であるが、多くの欠点も存在する。例えば,悪意あるサイトの多くは毎日のように生成され、ブラックリストの生成が追いついていない。本論文では、異なるembedding方法と異なる機械学習モデルを用いて悪意あるURLを検出する方法を比較・評価する。さらに、これらのembedding方法と機械学習モデルの精度を比較した。我々の評価では、トークン分割方法とTF-IDFの組み合わせの性能が良いことを実験的に明らかにした。その結果,URLの分割方法が悪意あるURL検出に重要な役割を果たすという結論を得た。
抄録(英) Nowadays, Internet access is becoming more and more popular, which makes the harm of malicious websites more and more serious. There are many solutions to solve this problem such as Google Safe Browsing, which check whether the website is malicious. A blacklist method is very useful for detect malicious URL but there are still many shortcomings. For example, a lot of new malicious websites are generated every day, and the speed of blacklist expansion can not keep up. In this paper, we use different embedding methods and different machine learning models to detecting malicious URLs. Besides, we compared the accuracy of these embedding methods and machine learning models. In our evaluation, the embedding algorithm TF-IDF and Token segmentation method obtain a good performance and we draw a conclusion that segmentation method plays an important role in malicious URLs detection.
キーワード(和) 機械学習 / 悪性あるURL検知 / 埋め込み方法 / 分割方法
キーワード(英) Machine learning / Malicious URLs detection / Embedding / Segmentation method
資料番号 IT2020-157,ISEC2020-87,WBS2020-76
発行日 2021-02-25 (IT, ISEC, WBS)

研究会情報
研究会 WBS / IT / ISEC
開催期間 2021/3/4(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) WBS・IT・ISEC合同研究会
テーマ(英) Joint Meeting of WBS, IT, and ISEC
委員長氏名(和) 浜村 昌則(高知工科大) / 和田山 正(名工大) / 廣瀬 勝一(福井大)
委員長氏名(英) Masanori Hamamura(Kochi Univ. of Tech.) / Tadashi Wadayama(Nagoya Inst. of Tech.) / Shoichi Hirose(Univ. of Fukui)
副委員長氏名(和) 庄納 崇(インテル) / 藤井 雅弘(宇都宮大) / 小嶋 徹也(東京高専) / 伊豆 哲也(富士通研) / 國廣 昇(筑波大学)
副委員長氏名(英) Takashi Shono(INTEL) / Masahiro Fujii(Utsunomiya Univ.) / Tetsuya Kojima(Tokyo Kosen) / Tetsuya Izu(Fujitsu Labs.) / Noboru Kunihiro(Tsukuba Univ.)
幹事氏名(和) 荒井 伸太郎(岡山理科大) / 中村 僚兵(防衛大) / 野崎 隆之(山口大) / 廣友 雅徳(佐賀大) / 面 和成(筑波大) / 山本 大(富士通研)
幹事氏名(英) Shintaro Arai(Okayama Univ. of Science) / Ryohei Nakamura(National Defence Academy) / Takayuki Nozaki(Yamaguchi Univ.) / Masanori Hirotomo(Saga Univ.) / Kazunari Omote(Tsukuba Univ.) / Dai Yamamoto(Fujitsu Labs.)
幹事補佐氏名(和) Duong Quang Thang(奈良先端大) / 森山 雅文(NICT) / 木下 雅之(千葉工大) / 太田 隆博(専修大) / 米山 一樹(茨城大)
幹事補佐氏名(英) Duong Quang Thang(NAIST) / Masafumi Moriyama(NICT) / Masayuki Kinoshita(Chiba Univ. of Tech.) / Takahiro Ohta(Senshu Univ.) / Kazuki Yoneyama(Ibaraki Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Wideband System / Technical Committee on Information Theory / Technical Committee on Information Security
本文の言語 ENG-JTITLE
タイトル(和) 悪性URL検知のためのEmbedding手法と機械学習モデルについての考察
サブタイトル(和)
タイトル(英) Consideration of embedding methods and machine learning models for detecting malicious URLs
サブタイトル(和)
キーワード(1)(和/英) 機械学習 / Machine learning
キーワード(2)(和/英) 悪性あるURL検知 / Malicious URLs detection
キーワード(3)(和/英) 埋め込み方法 / Embedding
キーワード(4)(和/英) 分割方法 / Segmentation method
第 1 著者 氏名(和/英) 陳 啓晟 / Qisheng Chen
第 1 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. of Tsukuba)
第 2 著者 氏名(和/英) 面 和成 / Kazumasa omote
第 2 著者 所属(和/英) 筑波大学(略称:筑波大)
University of Tsukuba(略称:Univ. of Tsukuba)
発表年月日 2021-03-05
資料番号 IT2020-157,ISEC2020-87,WBS2020-76
巻番号(vol) vol.120
号番号(no) IT-410,ISEC-411,WBS-412
ページ範囲 pp.281-287(IT), pp.281-287(ISEC), pp.281-287(WBS),
ページ数 7
発行日 2021-02-25 (IT, ISEC, WBS)