講演抄録/キーワード |
講演名 |
2016-10-27 11:20
咽喉マイクとピンマイクの同時集音に基づく多人数会話における発話区間推定に関する研究 ○大高祥裕・綱川隆司・西田昌史・西村雅史(静岡大) SP2016-43 |
抄録 |
(和) |
多人数会話の分析において,話者および発話区間の正確な同定は重要な課題となっている.発話の分離をより正確に行うため,話者毎にヘッドセットマイク等を装着して収録を行うこともあるが,それでも周囲話者の発話の混入や重畳によって相槌や同調の正確な検出が困難になる場合も多い.本論文では,多人数会話の環境においても他話者の発話の影響を受けにくい咽喉マイクの利用を検討した.さらに,ピンマイクでの収録音を併用することで,空嚥下や衣擦れ音などの咽喉マイク特有の雑音による誤検出を軽減できることを示す.また,多人数データの収録を簡便に実施するため,スマートフォンを用いたオンラインデータ収録システムも構築した.高齢者5名による長時間の自由会話を収録し,発話区間の検出性能を評価したので報告する. |
(英) |
For analyzing multi-party conversations, accurate identification of the speaker and speech segment is important. For more accurate separation of the speech segments, multi-channel recording by using headset microphones is usually tried. Nevertheless, it has been difficult to detect the back-channel feedback and sympathize section, which tend to be superimposed on speech of the surrounding speaker. In this paper, we use throat microphone for stable recording of the target speaker without capturing the surrounding speech in the multi-party conversation. We propose a voice activity detection method using 2ch recording of throat microphone and lavalier microphone. The experimental results showed an improvement of voice activity detection performance by the proposed method. Besides, we developed on-line recording system working on smartphone to efficiently collect the Multi-party conversations. Furthermore, we collected multi-party conversations with elderly people and evaluated a voice activity detection performance of the proposed method. |
キーワード |
(和) |
発話区間推定 / GMM / 咽喉マイク / 多人数会話 / / / / |
(英) |
Voice Activity Detection / GMM / Throat Microphone / Multi-party Conversation / / / / |
文献情報 |
信学技報, vol. 116, no. 279, SP2016-43, pp. 15-20, 2016年10月. |
資料番号 |
SP2016-43 |
発行日 |
2016-10-20 (SP) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
SP2016-43 |
|