講演名 2017-07-21
著者分析
ブーアジジ モンデル(慶大), ベイレリャン アンソニー(慶大), 渡辺 創(慶大), 大槻 知明(慶大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 著者分析とは, 著者のデータから性別, 年齢層, 性格などの特徴を自動的に分類する技術である. この技術は主に広告やマーケティングの分野で役立つ. 例えば, 商品のレビューなどは匿名であるが, 著者分析によってグループ化が可能である. 本研究では, 著者の性別と年齢層の分類のための新たな手法を提案する. 提案法に用いる特徴量は主に確率的特徴と文章の書き方の特徴から成り, 文章から自動で抽出できる. 提案法では, それらの特徴量を用いた機械学習によって分類する. 分類器に''Random Forest''を用い, データセットは様々な著者の Twitter のつぶやきを用いた実験において, 提案法は性別の分類で 83%, 年齢の分類で73% の精度を得た.
抄録(英) Author profiling refers to the process of automatically detecting characteristic of a given author such as his gender, age range or personality from his own data. This is mainly useful in fields such as advertising and marketing where reviewers of products for example are grouped based on such characteristics even if they are anonymous. In this paper, we propose new sets of features, aimed at short text samples written by the same author, for both gender and age range detection. The feature sets are mainly composed of both probabilistic features as well as writing patterns, which can be automatically extracted from the texts of the author. We evaluate the performance of these features using the Machine Learning algorithm ``Random Forest'' classifier and a dataset based on different authors’Twitter feeds. In our experiments, the proposed approach reaches a detection accuracy of up to 83% for gender and 73% for age range.
キーワード(和) Twitter / 著者分析 / 機械学習
キーワード(英) Twitter / Author Profiling / Machine Learning
資料番号 ASN2017-60
発行日 2017-07-12 (ASN)

研究会情報
研究会 NS / ASN / RCC / RCS / SR
開催期間 2017/7/19(から3日開催)
開催地(和) 北海道大学
開催地(英) Hokkaido Univ.
テーマ(和) 無線分散ネットワーク,M2M (Machine-to-Machine),D2D (Device-to-Device),一般
テーマ(英) Wireless Distributed Network, M2M (Machine-to-Machine), D2D (Device-to-Device),etc.
委員長氏名(和) 戸出 英樹(阪府大) / 岡田 啓(名大) / 原 晋介(阪市大) / 村田 英一(京大) / 梅林 健太(東京農工大)
委員長氏名(英) Hideki Tode(Osaka Pref. Univ.) / Hiraku Okada(Nagoya Univ.) / Shinsuke Hara(Osaka City Univ.) / Hidekazu Murata(Kyoto Univ.) / Kenta Umebayashi(Tokyo Univ. of Agric. and Tech.)
副委員長氏名(和) 岡崎 義勝(NTT) / 塩川 茂樹(神奈川工科大) / 中澤 仁(慶大) / 山野 悟(NEC) / 林 和則(阪市大) / 三浦 龍(NICT) / 眞田 幸俊(慶大) / 福田 英輔(富士通研) / 須山 聡(NTTドコモ) / 有吉 正行(NEC) / 亀田 卓(東北大)
副委員長氏名(英) Yoshikatsu Okazaki(NTT) / Shigeki Shiokawa(KAIT) / Jin Nakazawa(Keio Univ.) / Satoru Yamano(NEC) / Kazunori Hayashi(Osaka City Univ.) / Ryu Miura(NICT) / Yukitoshi Sanada(Keio Univ.) / Eisuke Fukuda(Fujitsu Labs.) / Satoshi Suyama(NTT DoCoMo) / Masayuki Ariyoshi(NEC) / Suguru Kameda(Tohoku Univ.)
幹事氏名(和) 塚本 和也(九工大) / 松井 健一(NTT) / 大和田 泰伯(NICT) / 萬代 雅希(上智大) / 石井 光治(香川大) / 小林 孝一(北大) / 旦代 智哉(東芝) / 西村 寿彦(北大) / 石津 健太郎(NICT) / 矢野 一人(ATR)
幹事氏名(英) Kazuya Tsukamoto(Kyushu Inst. of Tech.) / Kenichi Matsui(NTT) / Yasunori Owada(NICT) / Masaki Bandai(Sophia Univ.) / Koji Ishii(Kagawa Univ.) / Koichi Kobayashi(Hokkaido Univ.) / Tomoya Tandai(Toshiba) / Toshihiko Nishimura(Hokkaido Univ.) / Kentaro Ishidu(NICT) / Kazuto Yano(ATR)
幹事補佐氏名(和) 橿渕 健一(NTT) / 間 博人(同志社大) / 大田 知行(広島市立大) / 菊月 達也(富士通研) / 中野 亮(日立) / 堀田 善文(三菱電機) / 加川 敏規(NICT) / 小林 健太郎(名大) / 山本 哲矢(パナソニック) / 石原 浩一(NTT) / 村岡 一志(NEC) / 衣斐 信介(阪大) / 西本 浩(三菱電機) / 稲森 真美子(東海大) / 芝 宏礼(NTT) / Gia Khanh Tran(東工大) / 成枝 秀介(明石高専)
幹事補佐氏名(英) Kenichi Kashibuchi(NTT) / Hiroto Aida(Doshisha Univ.) / Tomoyuki Ota(Hiroshima City Univ.) / Tatsuya Kikuzuki(Fujitu Lab.) / Ryo Nakano(HITACHI) / Yoshifumi Hotta(Mitsubishi Electric) / Toshinori Kagawa(NICT) / Kentaro Kobayashi(Nagoya Univ.) / Tetsuya Yamamoto(Panasonic) / Koichi Ishihara(NTT) / Kazushi Muraoka(NEC) / Shinsuke Ibi(Osaka Univ.) / Hiroshi Nishimoto(Mitsubishi Electric) / Mamiko Inamori(Tokai Univ.) / Hiroyuki Shiba(NTT) / Gia Khanh Tran(Tokyo Inst. of Tech.) / Syusuke Narieda(NIT, Akashi College)

講演論文情報詳細
申込み研究会 Technical Committee on Network Systems / Technical Committee on Ambient intelligence and Sensor Networks / Technical Committee on Reliable Communication and Control / Technical Committee on Radio Communication Systems / Technical Committee on Smart Radio
本文の言語 JPN
タイトル(和) 著者分析
サブタイトル(和) 短文からの性別と年齢層の分類
タイトル(英) Author Profiling
サブタイトル(和) Gender and Age Detection from Short Texts
キーワード(1)(和/英) Twitter / Twitter
キーワード(2)(和/英) 著者分析 / Author Profiling
キーワード(3)(和/英) 機械学習 / Machine Learning
第 1 著者 氏名(和/英) ブーアジジ モンデル / Bouazizi Mondher
第 1 著者 所属(和/英) 慶應義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
第 2 著者 氏名(和/英) ベイレリャン アンソニー / Beylerian Anthony
第 2 著者 所属(和/英) 慶應義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
第 3 著者 氏名(和/英) 渡辺 創 / Watanabe Hajime
第 3 著者 所属(和/英) 慶應義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
第 4 著者 氏名(和/英) 大槻 知明 / Ohtsuki Tomoaki
第 4 著者 所属(和/英) 慶應義塾大学(略称:慶大)
Keio University(略称:Keio Univ.)
発表年月日 2017-07-21
資料番号 ASN2017-60
巻番号(vol) vol.117
号番号(no) ASN-134
ページ範囲 pp.241-246(ASN),
ページ数 6
発行日 2017-07-12 (ASN)