講演名 2019-09-27
利用規約中の不公平文の自動検出
青山 恵子(名大), 小川 泰弘(名大), 駒水 孝裕(名大), 外山 勝彦(名大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) サービスの利用規約は条項が多く,読むのに時間がかかるため,ユーザに読み飛ばされる傾向にあることが知られている.しかし,その中には注意が必要な条項が含まれる場合があり,それに気づかずにサービスを利用しているとトラブルに発展することがある.そこで,利用規約から不公平文を自動検出するシステムを検討した.先行研究では,英語利用規約に対してSVMを用いた手法が高い性能を示している.本稿では,日本語利用規約に対してSVMを用いた既存手法とランダムフォレストを用いた手法を比較した.その結果,日本語利用規約において既存手法の性能が低下した.このことから,そこに日本語利用規約特有の問題があることを示す.また,既存手法とランダムフォレストを用いる手法が異なる分類傾向を示すことから,アンサンブル手法が有効である可能性を示す.
抄録(英) Many users skip the terms of service (ToS) since they have many sentences and take time to read. However, they may include some sentences that require attention. If users use the service without knowing them, they may get into trouble. Therefore, we examine a system that automatically detects unfair sentences from the ToS, and compare the SVM system that showed high performance in the English ToS with a random forest (RF) system. As a result of the experiment, we show the performance of the existing SVM system deteriorated for the Japanese ToS and there is a problem peculiar to the Japanese ToS. In addition, since the SVM method and the RF method show different classification tendencies, we show the possibility of their ensemble method.
キーワード(和) 自然言語処理 / 利用規約 / 自動検出 / 不均衡データ
キーワード(英) Natural Language Processing / Terms of Service / Automatic Detection / Imbalanced Data
資料番号 NLC2019-8
発行日 2019-09-20 (NLC)

研究会情報
研究会 NLC / IPSJ-DC
開催期間 2019/9/27(から2日開催)
開催地(和) フューチャー株式会社
開催地(英) Future Corporation
テーマ(和) 第15回 テキストアナリティクス・シンポジウム
テーマ(英) The Thirteenth Text Analytics Symposium
委員長氏名(和) 榊 剛史(ホットリンク) / 秋元 良仁(凸版印刷)
委員長氏名(英) Takeshi Sakaki(Hottolink) / Ryoji Akimoto(Toppan Printing)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 嶋田 和孝(九工大)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT) / 大場 みち子(はこだて未来大) / 高橋 慈子(ハーティネス) / 中挾 知延子(東洋大) / 野々山 秀文(セコム)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT) / Michiko Oba(Future Univ. Hakodate) / Shigeko Takahashi(Heartiness) / Chieko Nakabasami(Toyo Univ.) / Hidefumi Nonoyama(Secom)
幹事補佐氏名(和) 小早川 健(NHK) / 坂地 泰紀(東大)
幹事補佐氏名(英) Takeshi Kobayakawa(NHK) / Hiroki Sakaji(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Document Communication
本文の言語 JPN
タイトル(和) 利用規約中の不公平文の自動検出
サブタイトル(和)
タイトル(英) Automatic Detection of Unfair Sentences in Terms of Service
サブタイトル(和)
キーワード(1)(和/英) 自然言語処理 / Natural Language Processing
キーワード(2)(和/英) 利用規約 / Terms of Service
キーワード(3)(和/英) 自動検出 / Automatic Detection
キーワード(4)(和/英) 不均衡データ / Imbalanced Data
第 1 著者 氏名(和/英) 青山 恵子 / Keiko Aoyama
第 1 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 2 著者 氏名(和/英) 小川 泰弘 / Yasuhiro Ogawa
第 2 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 3 著者 氏名(和/英) 駒水 孝裕 / Takahiro Komamizu
第 3 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
第 4 著者 氏名(和/英) 外山 勝彦 / Katsuhiko Toyama
第 4 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
発表年月日 2019-09-27
資料番号 NLC2019-8
巻番号(vol) vol.119
号番号(no) NLC-212
ページ範囲 pp.1-6(NLC),
ページ数 6
発行日 2019-09-20 (NLC)