講演名 2022-11-24
HDBSCANとDeep SVDDを用いたWebページの異常検知
野地 勇佑(同志社大), 木村 共孝(同志社大), 程 俊(同志社大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,深層学習の一つであるDeep SVDD (Support Vector Data Description) を用いた異常Web ページ の判定手法を検討する.Deep SVDD はサポートベクトルデータ記述法(SVDD)の改良であり,SVDD のカーネルを ニューラルネットワークに置き換え,正常なデータを含む超球を最小化する手法である.Deep SVDD では学習デー タの大部分が正常データであると仮定しているにも関わらず,学習データに一定の割合で異常なWeb ページが含まれ ることで学習が安定しない.そこで,本稿では,Deep SVDD を用いる前にクラスタリング手法を適用し,異常デー タを排除する手法を提案する.具体的には,密度ベースクラスタリング手法の一つであるHDBSCAN(Hierarchical Density-based Spatial Clustering of Applications with Noise) を用いて異常データを取り除く.Web ページデータセット を用いた実験によって,HDBSCAN によって異常データ点を取り除くことができ,異常点を取り除いたデータを学習 データにすることで,Deep SVDD の性能が安定することを示す.
抄録(英) In this paper, we propose an anomalous Web page detection method using Deep SVDD (Support Vector Data Description), which is one of deep learning methods. Although Deep SVDD assumes that most of the training data is normal data, the learning process is not stable because a certain percentage of abnormal web pages are included in the training data. Therefore, in this paper, we eliminate abnormal data by applying a clustering method before using Deep SVDD. Specifically, HDBSCAN (Hierarchical Density-based Spatial Clustering of Applications with Noise), a density-based clustering method, is used to remove anomalous data. Through experiments using a web page dataset, we show that HDBSCAN can remove anomalous data points and that the performance of Deep SVDD is stabilized by removing anomalous data.
キーワード(和) 異常検知 / 機械学習 / クラスタリング / Webページ
キーワード(英) anomaly detection / machine learning / clustering / web pages
資料番号 CQ2022-51
発行日 2022-11-17 (CQ)

研究会情報
研究会 NS / ICM / CQ
開催期間 2022/11/24(から2日開催)
開催地(和) 福岡大学文系センター棟 + オンライン開催
開催地(英) Humanities and Social Sciences Center, Fukuoka Univ. + Online
テーマ(和) ネットワーク品質,ネットワーク計測・管理,ネットワーク仮想化,ネットワークサービス,ブロックチェーン,セキュリティ,ネットワークインテリジェンス・AI,一般
テーマ(英) Network quality, Network measurement/management, Network virtualization, Network service, Blockchain, Security, Network intelligence/AI, etc.
委員長氏名(和) 大石 哲矢(NTT) / 野村 祐士(富士通) / 岡本 淳(NTT)
委員長氏名(英) Tetsuya Oishi(NTT) / Yuji Nomura(Fujitsu) / Jun Okamoto(NTT)
副委員長氏名(和) 三好 匠(芝浦工大) / 三好 優(NTT) / 高橋 英士(NEC) / 平栗 健史(日本工大) / 長谷川 剛(東北大)
副委員長氏名(英) Takumi Miyoshi(Shibaura Insti of Tech.) / Yu Miyoshi(NTT) / Eiji Takahashi(NEC) / Takefumi Hiraguri(Nippon Inst. of Tech.) / Gou Hasegawa(Tohoku Univ.)
幹事氏名(和) 池邉 隆(NTT) / 山口 実靖(工学院大) / 加藤 能史(NTT) / 内海 哲哉(富士通) / 恵木 則次(NTT) / 山本 寛(立命館大)
幹事氏名(英) Takashi Ikebe(NTT) / Saneyasu Yamaguchi(Kogakuin Univ.) / Yoshifumi Kato(NTT) / Tetsuya Uchiumi(Fujitsu) / Noritsugu Egi(NTT) / Hiroshi Yamamoto(Ritsumeikan Univ.)
幹事補佐氏名(和) 三原 孝太郎(NTT) / 山本 嶺(電通大) / 川嶋 喜美子(NTT) / 中村 遼(福岡大) / 中平 俊朗(NTT) / 塚常 健太(都立大)
幹事補佐氏名(英) Kotaro Mihara(NTT) / Ryo Yamamoto(Univ. of Electro-Comm) / Kimiko Kawashima(NTT) / Ryo Nakamura(Fukuoka Univ.) / Toshiro Nakahira(NTT) / Kenta Tsukatsune(Tokyo Metroplitan Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Network Systems / Technical Committee on Information and Communication Management / Technical Committee on Communication Quality
本文の言語 JPN
タイトル(和) HDBSCANとDeep SVDDを用いたWebページの異常検知
サブタイトル(和)
タイトル(英) Anomaly Detection on Web Pages Using HDBSCAN and Deep SVDD
サブタイトル(和)
キーワード(1)(和/英) 異常検知 / anomaly detection
キーワード(2)(和/英) 機械学習 / machine learning
キーワード(3)(和/英) クラスタリング / clustering
キーワード(4)(和/英) Webページ / web pages
第 1 著者 氏名(和/英) 野地 勇佑 / Yusuke Noji
第 1 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:Doshisha Univ.)
第 2 著者 氏名(和/英) 木村 共孝 / Tomotaka Kimura
第 2 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:Doshisha Univ.)
第 3 著者 氏名(和/英) 程 俊 / Jun Cheng
第 3 著者 所属(和/英) 同志社大学(略称:同志社大)
Doshisha University(略称:Doshisha Univ.)
発表年月日 2022-11-24
資料番号 CQ2022-51
巻番号(vol) vol.122
号番号(no) CQ-275
ページ範囲 pp.23-27(CQ),
ページ数 5
発行日 2022-11-17 (CQ)