大会名称
2017年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2017
発行日
2017-09-05
セッション番号
4D
セッション名
自然言語処理・基礎
講演日
2017/09/13
講演場所(会議室等)
2号館3階 231号講義室
講演番号
E-007
タイトル
Word2Vecによる分類・推定における事前処理法の提案
著者名
Tuan Dao Van佐藤 浩
キーワード
Word2Vec, Wikipedia, 分類, 推定, 事前処理
抄録
近年、SNS、株価、医学などを対象に、自然言語処理に関する様々な研究が行われている。英語はもちろん、日本語においては、 Wikipedia など、数多くの文書データが存在する。文書データから単語を抽出し、ベクトル化することによって分類、推薦などを行う方法が提案されており、実世界への応用もされている。ベクトル化手法としてはtf-idf法がよく知られているが、精度は高くない。既存研究ではWikipediaデータをWord2Vecで学習することで、従来手法であるtf-idf法より良い結果が得られたものの、精度が大きく上がることはなかった。本研究では、学習データに事前処理を施すことにより、機械学習を行なった先行研究より良い結果を得た。
本文pdf
PDF download (589KB)