大会名称
2019年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2019
発行日
2019-08-20
セッション番号
6g
セッション名
言語資源
講演日
2019/09/05
講演場所(会議室等)
一般教育棟 A棟 A42
講演番号
E-025
タイトル
日本語WordNetにおける語義・概念の分散表現獲得
著者名
國府大輝竹内孔一
キーワード
自然言語処理, 辞書, 言語資源, AutoExtend, 日本語WordNet
抄録
テキストから構築する既存の単語の分散表現では,語義の異なりは考慮されず同一のベクトルとして表現されてしまうため,分散表現を構築する際に語義の違いや対義語などの区別を学習することが難しい.一方,語義や概念で単語を分類した辞書構造を学習するAutoExtendが提案され,英語の辞書であるWordNetに適用されている.そこで本研究では,AutoExtendを日本語の辞書に適用し,語義・概念の分散表現の構築を目指す.分散表現の評価のために単語「美味しい」に対して分散表現間類似度の高い語義・概念を上位10件示し,今後の展望について議論する.
本文pdf
PDF download (258.6KB)