講演名 2016-10-27
咽喉マイクとピンマイクの同時集音に基づく多人数会話における発話区間推定に関する研究
大高 祥裕(静岡大), 綱川 隆司(静岡大), 西田 昌史(静岡大), 西村 雅史(静岡大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 多人数会話の分析において,話者および発話区間の正確な同定は重要な課題となっている.発話の分離をより正確に行うため,話者毎にヘッドセットマイク等を装着して収録を行うこともあるが,それでも周囲話者の発話の混入や重畳によって相槌や同調の正確な検出が困難になる場合も多い.本論文では,多人数会話の環境においても他話者の発話の影響を受けにくい咽喉マイクの利用を検討した.さらに,ピンマイクでの収録音を併用することで,空嚥下や衣擦れ音などの咽喉マイク特有の雑音による誤検出を軽減できることを示す.また,多人数データの収録を簡便に実施するため,スマートフォンを用いたオンラインデータ収録システムも構築した.高齢者5名による長時間の自由会話を収録し,発話区間の検出性能を評価したので報告する.
抄録(英) For analyzing multi-party conversations, accurate identification of the speaker and speech segment is important. For more accurate separation of the speech segments, multi-channel recording by using headset microphones is usually tried. Nevertheless, it has been difficult to detect the back-channel feedback and sympathize section, which tend to be superimposed on speech of the surrounding speaker. In this paper, we use throat microphone for stable recording of the target speaker without capturing the surrounding speech in the multi-party conversation. We propose a voice activity detection method using 2ch recording of throat microphone and lavalier microphone. The experimental results showed an improvement of voice activity detection performance by the proposed method. Besides, we developed on-line recording system working on smartphone to efficiently collect the Multi-party conversations. Furthermore, we collected multi-party conversations with elderly people and evaluated a voice activity detection performance of the proposed method.
キーワード(和) 発話区間推定 / GMM / 咽喉マイク / 多人数会話
キーワード(英) Voice Activity Detection / GMM / Throat Microphone / Multi-party Conversation
資料番号 SP2016-43
発行日 2016-10-20 (SP)

研究会情報
研究会 SP
開催期間 2016/10/27(から1日開催)
開催地(和) 静岡大学
開催地(英) Shizuoka University.
テーマ(和) 学習,認識,合成,対話,音声一般
テーマ(英) Learning, Recognition, Synthesis, Dialogue, etc.
委員長氏名(和) 間野 一則(芝浦工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN
タイトル(和) 咽喉マイクとピンマイクの同時集音に基づく多人数会話における発話区間推定に関する研究
サブタイトル(和)
タイトル(英) Voice Activity Detection Using Throat Microphone and Lavalier Microphone for Multi-Party Conversations
サブタイトル(和)
キーワード(1)(和/英) 発話区間推定 / Voice Activity Detection
キーワード(2)(和/英) GMM / GMM
キーワード(3)(和/英) 咽喉マイク / Throat Microphone
キーワード(4)(和/英) 多人数会話 / Multi-party Conversation
第 1 著者 氏名(和/英) 大高 祥裕 / Yoshihiro Otaka
第 1 著者 所属(和/英) 静岡大学(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
第 2 著者 氏名(和/英) 綱川 隆司 / Takashi Tsunakawa
第 2 著者 所属(和/英) 静岡大学(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
第 3 著者 氏名(和/英) 西田 昌史 / Masafumi Nishida
第 3 著者 所属(和/英) 静岡大学(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
第 4 著者 氏名(和/英) 西村 雅史 / Masafumi Nishimura
第 4 著者 所属(和/英) 静岡大学(略称:静岡大)
Shizuoka University(略称:Shizuoka Univ.)
発表年月日 2016-10-27
資料番号 SP2016-43
巻番号(vol) vol.116
号番号(no) SP-279
ページ範囲 pp.15-20(SP),
ページ数 6
発行日 2016-10-20 (SP)