大会名称
2019年 総合大会
大会コ-ド
2019G
開催年
2019
発行日
2019-03-05
セッション番号
D-4
セッション名
データ工学
講演日
2019/03/21
講演場所(会議室等)
54号館 103教室
講演番号
D-4-11
タイトル
尤度関数の計算コスト削減によるword2vecの高速化手法の提案
著者名
◎中村開耶木村昌臣
キーワード
word2vec, CBOW, 高速化
抄録
近年,単語を周辺単語の分布を基にベクトルを割り当てる手法としてword2vecが注目されている.これにより単語の意味を定量的に表すことができようになった.word2vecを使用した解析では,最初にコーパスを用いて単語を学習させ,モデルを作成する.以降の解析では最初に作成したモデルを使用する.もし始めに作ったモデルが学習していない単語が多く出てくる文書を解析する時は,またモデルの再作成する必要がある.しかしword2vecの学習は計算量が多いため,長い時間が必要になる.先行研究ではword2vecのモデルの1つSkip-gramを高速化する研究がなされている.本研究ではword2vecモデルの1つであるCBOWの学習の高速化を目的とし,尤度関数を計算量が少ない関数へ近似する方法を検討した.
本文pdf
PDF download   

PayPerView