講演名 2017-03-02
[ポスター講演]複数人対話のためのRNN言語モデルにおける発話終端と話者情報の利用法
芦川 博人(早大), 俵 直弘(早大), 小川 厚徳(NTT), 岩田 具治(NTT), 小川 哲司(早大), 小林 哲則(早大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 複数人による対話において発話される単語の予測性能向上を目的として,複数人対話特有の現象として頻出する発話終端や話者交替に関する情報の,リカレントニューラルネットワーク言語モデルにおける利用法について検討を行った.発話終端や話者交替に関する情報をコンテキストキューにより表現して他の単語と同等に扱う方法と,特徴ベクトルにより表現してニューラルネットワークに組み込む方法について,実際の複数人対話データを用いて評価を行った.評価の結果,これら二つの方法はどちらも有効であること,および発話終端の情報がとりわけ複数人対話において単語予測性能の向上に大きく寄与することがわかった.
抄録(英) Information on the end of sentence (EOS) and speaker alternation was exploited in recurrent neural network-based language models and its contribution to improvement in performance of predicting subsequent wordsin multiparty conversations was investigated. These kinds of information were represented as context cues and feature vectors. The former context cues can be inserted to the transcriptions for training, equivalently as other word tokens. The latter feature vectors can be taken as inputs to the neural networks. Experimental comparisons using actual multiparty conversations demonstrated that both representations reduced the perplexity compared tothe case without the EOS and speaker information. The EOS information contributed a lot to improvement in performance of word prediction, especially for multiparty conversations.
キーワード(和) リカレントニューラルネットワーク / コンテキストキュー / 言語モデル / 複数人対話
キーワード(英) recurrent neural network / context cue / language model / multiparty conversation
資料番号 EA2016-133,SIP2016-188,SP2016-128
発行日 2017-02-22 (EA, SIP, SP)

研究会情報
研究会 SP / SIP / EA
開催期間 2017/3/1(から2日開催)
開催地(和) 沖縄産業支援センター
開催地(英) Okinawa Industry Support Center
テーマ(和) 音声,応用/電気音響,信号処理,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics
委員長氏名(和) 間野 一則(芝浦工大) / 中静 真(千葉工大) / 水町 光徳(九工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大) / 奥田 正浩(北九州市大) / 村松 正吾(新潟大) / 羽田 陽一(電通大) / 島内 末廣(NTT)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.) / Masahiro Okuda(Univ. of Kitakyushu) / Shogo Muramatsu(Niigata Univ.) / Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大) / 平林 晃(立命館大) / 宮田 高道(千葉工大) / 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) / Akira Hirabayashi(Ritsumeikan Univ.) / Takamichi Miyata(Chiba Inst. of Tech.) / Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大) / 渡邊 修(拓殖大) / 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics
本文の言語 JPN
タイトル(和) [ポスター講演]複数人対話のためのRNN言語モデルにおける発話終端と話者情報の利用法
サブタイトル(和)
タイトル(英) [Poster Presentation] Use of the end of sentence and speaker-derived information in recurrent neural network language models for multiparty conversations.
サブタイトル(和)
キーワード(1)(和/英) リカレントニューラルネットワーク / recurrent neural network
キーワード(2)(和/英) コンテキストキュー / context cue
キーワード(3)(和/英) 言語モデル / language model
キーワード(4)(和/英) 複数人対話 / multiparty conversation
第 1 著者 氏名(和/英) 芦川 博人 / Hiroto Ashikawa
第 1 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 2 著者 氏名(和/英) 俵 直弘 / Naohiro Tawara
第 2 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 3 著者 氏名(和/英) 小川 厚徳 / Atsunori Ogawa
第 3 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
第 4 著者 氏名(和/英) 岩田 具治 / Tomoharu Iwata
第 4 著者 所属(和/英) 日本電信電話株式会社(略称:NTT)
Nippon Telegraph and Telephone Corporation(略称:NTT)
第 5 著者 氏名(和/英) 小川 哲司 / Tetsuji Ogawa
第 5 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
第 6 著者 氏名(和/英) 小林 哲則 / Tetsunori Kobayashi
第 6 著者 所属(和/英) 早稲田大学(略称:早大)
Waseda University(略称:Waseda Univ.)
発表年月日 2017-03-02
資料番号 EA2016-133,SIP2016-188,SP2016-128
巻番号(vol) vol.116
号番号(no) EA-475,SIP-476,SP-477
ページ範囲 pp.287-290(EA), pp.287-290(SIP), pp.287-290(SP),
ページ数 4
発行日 2017-02-22 (EA, SIP, SP)