講演抄録/キーワード |
講演名 |
2020-03-02 11:50
コンテンツフィルタを回避する敵対的映像データ ○大森敬仁・森 達哉(早大) ICSS2019-95 |
抄録 |
(和) |
YouTube をはじめとしたインターネット動画共有サイトでは,日々ユーザーが生成したコンテンツ(UGC)が大量にアップロードされている.UGC には暴力や差別を助長するような不適切なコンテンツが数多く存在する.そうした大量の動画データから不適切な動画を自動的に検知する有望なアプローチとして,様々なタスクで高精度な識別性能を示す機械学習アルゴリズムであるニューラルネットワークが適用されるケースが増えている.一方,ニューラルネットワークには,敵対的入力(adversarial input)と呼ばれる固有の脆弱性がある.すなわち敵対的入力により,ニューラルネットワークの識別を意図的に誤らせることが可能である.本研究では,不適切なコンテンツフィルタを行うニューラルネットワークに対する,敵対的入力による攻撃の実証評価を行う.暴力的な動画コンテンツであるか否かを識別するホワイトボックス実装に対して,有効な敵対的入力の構成法を調査した.また,生成した敵対的入力は人間によってどのように認知されるかをユーザスタディにより明らかにする. |
(英) |
A huge number of user-generated contents (UGC) are being uploaded on prominent internet video sharing sites such as YouTube. Such UGC includes many inappropriate content such as violence and discrimination. As a promising approach to automatically detect such inappropriate content from a huge volume of uploaded movies, machine-learning approaches using neural networks are increasingly becoming popular. On the other hand, it is well known that neural networks have an inherent vulnerability called ``adversarial input''. That is, it is possible to intentionally let a neural network misclassify an input by generating adversarial inputs. In this paper, we attempt to study whether an attacker can generate adversarial inputs against a neural network-based inappropriate content filtering system. This paper studies how to construct an effective adversarial input for a white box implementation that identifies whether or not an uploaded video contains violent scenes. We also perform user study that aims to study how generated adversarial input is perceived by human. |
キーワード |
(和) |
動画コンテンツフィルタ / 敵対的入力 / ニューラルネットワーク / / / / / |
(英) |
video content filtering / adversarial input / neural network / / / / / |
文献情報 |
信学技報, vol. 119, no. 437, ICSS2019-95, pp. 201-206, 2020年3月. |
資料番号 |
ICSS2019-95 |
発行日 |
2020-02-24 (ICSS) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
ICSS2019-95 |