講演抄録/キーワード |
講演名 |
2016-12-20 09:55
Hard-Attentional Neural Network Models for Emphasis Speech Translation ○Quoc Truong Do・Sakriani Sakti・Graham Neubig・Satoshi Nakamura(NAIST) SP2016-50 |
抄録 |
(和) |
一般的な音声翻訳システムにおいて、発話に含まれる非言語情報は翻訳されない。先行研究において、この問題に対し条件付き確率場(CRF s)を用いた手法を提案した。CRF sを用いることで、多くの素性を扱い、局所的な文脈情報も考慮できるようになった。一方で、CRFs は連続的な変数を扱うことが困難であり、長期的な依存関係を表現することが難しい。本論文では、注意型ニューラルネットワークを用いた強調音声の翻訳手法を提案する。また、人手による主観評価を通して、翻訳言語上で強調か否かを予測する実験において先行研究よりも F 値で 4%性能が向上したことを示す。 |
(英) |
Traditional speech translation systems are oblivious to paralinguistic information. A recent work has tried to tackle this task by utilizing conditional random fields (CRFs). Although CRFs allow for consideration of rich features and local context, they have difficulty in handling continuous variables, and cannot capture long-distance dependencies easily. In this paper, we propose a new model for emphasis transfer in speech translation using an approach based on neural networks. Our experiments showed a significant improvement of the proposed model over the previous model by 4% target-language emphasis prediction F-measure according to objective evaluation. |
キーワード |
(和) |
協調翻訳 / 音声翻訳 / 注意型ニューラルネットワーク / ハードアテンション / / / / |
(英) |
Emphasis translation / speech translation / attentional network model / hard-attentional / / / / |
文献情報 |
信学技報, vol. 116, no. 378, SP2016-50, pp. 7-8, 2016年12月. |
資料番号 |
SP2016-50 |
発行日 |
2016-12-13 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
査読に ついて |
本技術報告は査読を経ていない技術報告であり,推敲を加えられていずれかの場に発表されることがあります. |
PDFダウンロード |
SP2016-50 |