大会名称 |
---|
2017年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2017 |
発行日 |
2017-09-05 |
セッション番号 |
4D |
セッション名 |
自然言語処理・基礎 |
講演日 |
2017/09/13 |
講演場所(会議室等) |
2号館3階 231号講義室 |
講演番号 |
E-007 |
タイトル |
Word2Vecによる分類・推定における事前処理法の提案 |
著者名 |
Tuan Dao Van, 佐藤 浩, |
キーワード |
Word2Vec, Wikipedia, 分類, 推定, 事前処理 |
抄録 |
近年、SNS、株価、医学などを対象に、自然言語処理に関する様々な研究が行われている。英語はもちろん、日本語においては、 Wikipedia など、数多くの文書データが存在する。文書データから単語を抽出し、ベクトル化することによって分類、推薦などを行う方法が提案されており、実世界への応用もされている。ベクトル化手法としてはtf-idf法がよく知られているが、精度は高くない。既存研究ではWikipediaデータをWord2Vecで学習することで、従来手法であるtf-idf法より良い結果が得られたものの、精度が大きく上がることはなかった。本研究では、学習データに事前処理を施すことにより、機械学習を行なった先行研究より良い結果を得た。 |
本文pdf |
PDF download (589KB) |