講演抄録/キーワード |
講演名 |
2017-03-02 09:00
[ポスター講演]複数人対話のためのRNN言語モデルにおける発話終端と話者情報の利用法 ○芦川博人・俵 直弘(早大)・小川厚徳・岩田具治(NTT)・小川哲司・小林哲則(早大) EA2016-133 SIP2016-188 SP2016-128 |
抄録 |
(和) |
複数人による対話において発話される単語の予測性能向上を目的として,複数人対話特有の現象として頻出する発話終端や話者交替に関する情報の,リカレントニューラルネットワーク言語モデルにおける利用法について検討を行った.
発話終端や話者交替に関する情報をコンテキストキューにより表現して他の単語と同等に扱う方法と,特徴ベクトルにより表現してニューラルネットワークに組み込む方法について,実際の複数人対話データを用いて評価を行った.
評価の結果,これら二つの方法はどちらも有効であること,および発話終端の情報がとりわけ複数人対話において単語予測性能の向上に大きく寄与することがわかった. |
(英) |
Information on the end of sentence (EOS) and speaker alternation was exploited in recurrent neural network-based language models and its contribution to improvement in performance of predicting subsequent words
in multiparty conversations was investigated.
These kinds of information were represented as context cues and feature vectors.
The former context cues can be inserted to the transcriptions for training, equivalently as other word tokens.
The latter feature vectors can be taken as inputs to the neural networks. Experimental comparisons using actual multiparty conversations demonstrated that both representations reduced the perplexity compared to
the case without the EOS and speaker information.
The EOS information contributed a lot to improvement in performance of word prediction, especially for multiparty conversations. |
キーワード |
(和) |
リカレントニューラルネットワーク / コンテキストキュー / 言語モデル / 複数人対話 / / / / |
(英) |
recurrent neural network / context cue / language model / multiparty conversation / / / / |
文献情報 |
信学技報, vol. 116, no. 477, SP2016-128, pp. 287-290, 2017年3月. |
資料番号 |
SP2016-128 |
発行日 |
2017-02-22 (EA, SIP, SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
EA2016-133 SIP2016-188 SP2016-128 |