電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ/通ソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2019-09-28 17:30
既知の単語の分散表現を用いた未知の複合語の分散表現の推定法
高木涼太風間一洋和歌山大)・榊 剛史ホットリンク
技報オンラインサービス実施中
抄録 (和) 近年,単語の意味を低次元のベクトル表現として扱う分散表現が広く使われている.この分散表現を求め る手法は様々であるが,例えば Mikolov らが提案した word2vec では,単語とその周辺の単語をニューラルネットワー クで学習し,学習結果の中間層の重みのベクトルを分散表現として用いる.しかし,word2vec では学習に用いた単語 の分散表現しか得られないために,既知の単語を組み合わせた複合語であっても再学習する必要があるが,そのため には多大な追加コストが必要になる.このような再学習を避けるために,本稿では,学習済みの分散表現データと単 語に関する統計値を用いて,未知の複合語の分散表現を比較的高い精度で推定する手法を提案する.実際には,日本 語の複合語を構成する名詞間の修飾関係に着目して,単名詞 2-gram の連接頻度から重み付けを行う.さらに,単語の 分散表現から文の分散表現を求めるために用いられるベクトルの単純平均や Arora らの手法などと類似度・MRR を 比較し,提案手法の有効性を示す. 
(英) In recent years, the distributed expression, which treats the meaning of a word as a low-dimensional vector expression, is widely used. There are various methods to obtain the distributed expression of a word. For example, Mikolov et al. proposed word2vec that learns the surrounding words of a word by a neural network, and outputs the vector of weights in the middle layer of the learning result as a distributed representation, However, an unknown compound word should be re-learn even if it is a known word sequences because only distributed repre- sentations of words, which are used for learning, are available in word2vec. It requires a lot of additional cost. We propose a method to estimate the distributed expression of unknown compound words with relatively high accuracy, using distributed expression data that has been already learned and a simple statistical indicator. In practice, we focus on the modification relation between nouns that constitute a Japanese compound words and weight distributed expression vectors by compound noun frequency of noun 2-grams. Additionally, we compare the similarity and the MRR of the proposed method with those of other methods that are used to obtain the distributed expression of a sentence using the distributed expression of words such as the simple average method and the method proposed by Arora et al. etc. We show the effectiveness of the proposed method.
キーワード (和) 複合語 / 分散表現 / word2vec / 名詞連接頻度 / 修飾関係 / / /  
(英) compound words / distributed representation / word2vec / compound noun frequency / modification relation / / /  
文献情報 信学技報, vol. 119, no. 212, NLC2019-27, pp. 103-108, 2019年9月.
資料番号 NLC2019-27 
発行日 2019-09-20 (NLC) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 NLC IPSJ-DC  
開催期間 2019-09-27 - 2019-09-28 
開催地(和) フューチャー株式会社 
開催地(英) Future Corporation 
テーマ(和) 第15回 テキストアナリティクス・シンポジウム 
テーマ(英) The Thirteenth Text Analytics Symposium 
講演論文情報の詳細
申込み研究会 NLC 
会議コード 2019-09-NLC-DC 
本文の言語 日本語 
タイトル(和) 既知の単語の分散表現を用いた未知の複合語の分散表現の推定法 
サブタイトル(和)  
タイトル(英) Estimating Distributed Expressions of Unknown Compound Word Using Distributed Expressions of Known Words 
サブタイトル(英)  
キーワード(1)(和/英) 複合語 / compound words  
キーワード(2)(和/英) 分散表現 / distributed representation  
キーワード(3)(和/英) word2vec / word2vec  
キーワード(4)(和/英) 名詞連接頻度 / compound noun frequency  
キーワード(5)(和/英) 修飾関係 / modification relation  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 高木 涼太 / Ryota Takagi / タカギ リョウタ
第1著者 所属(和/英) 和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ)
第2著者 氏名(和/英/ヨミ) 風間 一洋 / Kazuhiro Kazama / カザマ カズヒロ
第2著者 所属(和/英) 和歌山大学 (略称: 和歌山大)
Wakayama University (略称: Wakayama Univ)
第3著者 氏名(和/英/ヨミ) 榊 剛史 / Takeshi Sakaki / サカキ タケシ
第3著者 所属(和/英) 株式会社ホットリンク (略称: ホットリンク)
Hotto Link Inc. (略称: Hotto Link)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2019-09-28 17:30:00 
発表時間 25 
申込先研究会 NLC 
資料番号 IEICE-NLC2019-27 
巻番号(vol) IEICE-119 
号番号(no) no.212 
ページ範囲 pp.103-108 
ページ数 IEICE-6 
発行日 IEICE-NLC-2019-09-20 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会