講演名 2018-07-06
参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
藤川 寛基(北大), 越前谷 博(北海学園大), 荒木 健治(北大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来より参照訳との表層的な一致に基づき機械翻訳が出力する訳文を評価する自動評価法が提案されている.しかし,実際ユーザが機械翻訳を利用する際には参照訳がない場合が多いことから,参照訳を用いずに訳文を評価することのニーズが高まっている.そこで,大規模な対訳コーパスから参照訳を用いず訳文の品質推定を行う研究もある.しかし,英日のように大規模な対訳コーパスが乏しい言語間では用いることが困難である.よって,本稿では大規模対訳コーパスを用いずに翻訳対象文と訳文の異言語文間類似度を用いて訳文を評価する手法を提案する.提案手法では,単語分散表現を翻訳行列によって異言語空間へマッピングした後Earth Mover’s Distanceにより異言語文間類似度を計算することで対訳コーパスを用いることなく訳文を評価する.
抄録(英) We propose a new method for automatic evaluation method for machine translation without reference. Automatic evaluation of machine translation is generally based on the use of reference. However, when the user wants to know the quality of the translation, there is no reference in most cases. Though there is a research to estimate the quality of translation without reference ,it is difficult to use it because there is no large-scale bilingual corpus between English and Japanese. In this paper, our proposed method based on Cross-Lingual Similarity evaluates translation without bilingual corpus using word embeddngs and translation matrix.
キーワード(和) 機械翻訳 / 自動評価 / Word2Vec / Earth Mover's Distance
キーワード(英) Machine Translation / Automatic Evaluation / Word2Vec / Earth Mover's Distance
資料番号 NLC2018-5
発行日 2018-06-29 (NLC)

研究会情報
研究会 NLC / IPSJ-ICS
開催期間 2018/7/6(から2日開催)
開催地(和) 北海道大学
開催地(英) Hokkaido University
テーマ(和) 言語処理・知能システムの社会応用,および一般
テーマ(英) Application of natural language processing and intelligent systems, and general topic of NLP
委員長氏名(和) 榊 剛史(ホットリンク)
委員長氏名(英) Takeshi Sakaki(Hottolink)
副委員長氏名(和) 吉田 光男(豊橋技科大) / 嶋田 和孝(九工大)
副委員長氏名(英) Mitsuo Yoshida(Toyohashi Univ. of Tech.) / Kazutaka Shimada(Kyushu Inst. of Tech.)
幹事氏名(和) 渡辺 靖彦(龍谷大) / 東中 竜一郎(NTT)
幹事氏名(英) Yasuhiko Watanabe(Ryukoku Univ.) / Ryuichiro Higashinaka(NTT)
幹事補佐氏名(和) 小早川 健(NHK) / 坂地 泰紀(東大)
幹事補佐氏名(英) Takeshi Kobayakawa(NHK) / Hiroki Sakaji(Univ. of Tokyo)

講演論文情報詳細
申込み研究会 Technical Committee on Natural Language Understanding and Models of Communication / Special Interest Group on Intelligence and Complex Systems
本文の言語 JPN
タイトル(和) 参照訳を必要としない単語分散表現による異言語間類似度を用いた訳文の自動評価
サブタイトル(和)
タイトル(英) Automatic Evaluation Method for Machine Translation based on Cross-Lingual Similarity using Word Embeddings without Reference Translation
サブタイトル(和)
キーワード(1)(和/英) 機械翻訳 / Machine Translation
キーワード(2)(和/英) 自動評価 / Automatic Evaluation
キーワード(3)(和/英) Word2Vec / Word2Vec
キーワード(4)(和/英) Earth Mover's Distance / Earth Mover's Distance
第 1 著者 氏名(和/英) 藤川 寛基 / Hiroki Fujikawa
第 1 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
第 2 著者 氏名(和/英) 越前谷 博 / Hiroshi Echizenya
第 2 著者 所属(和/英) 北海学園大学(略称:北海学園大)
Hokkai-Gakuen University(略称:Hokkai-Gakuen Univ.)
第 3 著者 氏名(和/英) 荒木 健治 / Kenji Araki
第 3 著者 所属(和/英) 北海道大学(略称:北大)
Hokkaido University(略称:Hokkaido Univ.)
発表年月日 2018-07-06
資料番号 NLC2018-5
巻番号(vol) vol.118
号番号(no) NLC-122
ページ範囲 pp.51-56(NLC),
ページ数 6
発行日 2018-06-29 (NLC)