［ポスター講演］周波数領域両耳聴モデルを用いた複数話者同時発話時の話者識別に関する研究

清田 佳偉; イルワンシャー; 松岡 光祐; 宇佐川 毅

講演名	2019-01-22 ［ポスター講演］周波数領域両耳聴モデルを用いた複数話者同時発話時の話者識別に関する研究清田佳偉(熊本大), イルワンシャー(熊本大), 松岡光祐(熊本大), 宇佐川毅(熊本大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	近年，開発が進められている自動会議録作成支援システムでは，複数話者の発話が重畳したオーバラップ区間における，話者識別精度の低下が課題となっている．周波数領域両耳聴モデルは，人間の聴覚機能である音源分離機能をモデル化したものであり，同時発話理解への応用が期待される．本研究では，オーバラップ区間における精度改善を目的に周波数領域両耳聴モデルの利用を提案し，複数話者同時発話時における話者識別精度の評価を通して，その有用性について検討する．
抄録(英)	In order to realize the speech recognition system suitable for a small meeting logging with speaker identification, it is required to segregate speakers based on the direction of arrival at the microphone system. In this study, we propose a meeting logging system using a binaural recording and Frequency Domain Binaural Model for segregation of concurrent speeches. Performance of speakers identification under multiple talkers condition is examined.
キーワード(和)	周波数領域両耳聴モデル / 話者識別 / 混合ガウスモデル
キーワード(英)	Frequency Domain Binaural Model / Speaker Identification / Gaussian Mixture Model
資料番号	EA2018-94
発行日	2019-01-15 (EA)

研究会情報
研究会	EA / US
開催期間	2019/1/22(から2日開催)
開催地（和）	同志社大学
開催地（英）	Doshisha Univ.
テーマ（和）	＜音響・超音波サブソサイエティ合同研究会＞応用／電気音響，超音波，一般
テーマ（英）	[Joint Meeting on Acoustics and Ultrasonics Subsociety] Engineering/Electro Acoustics, Ultrasonics, and Related Topics
委員長氏名（和）	島内末廣(金沢工大) / 竹内真一(桐蔭横浜大)
委員長氏名（英）	Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shinichi Takeuchi(Toin Univ. of Yokohama)
副委員長氏名（和）	古家賢一(大分大) / 渡邉貫治(秋田県立大) / 黒澤実(東工大) / 近藤淳(静岡大)
副委員長氏名（英）	Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Minoru Kurosawa(Tokyo Inst. of Tech.) / Jun Kondo(Shizuoka Univ.)
幹事氏名（和）	武岡成人(静岡理工科大) / 松井健太郎(NHK) / 森田剛(東大) / 土屋健伸(神奈川大)
幹事氏名（英）	Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Takeshi Morita(Univ. of Tokyo) / Takenobu Tsuchiya(Kanagawa Univ.)
幹事補佐氏名（和）	井本桂右(立命館大) / 森川大輔(富山県立大) / 小山大介(同志社大)
幹事補佐氏名（英）	Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Daisuke Koyama(Doshisha Univ.)

講演論文情報詳細
申込み研究会	Technical Committee on Engineering Acoustics / Technical Committee on Ultrasonics
本文の言語	JPN
タイトル（和）	［ポスター講演］周波数領域両耳聴モデルを用いた複数話者同時発話時の話者識別に関する研究
サブタイトル（和）
タイトル（英）	[Poster Presentation] On speaker identification under multiple-talker condition using frequency domain binaural model
サブタイトル（和）
キーワード(1)（和/英）	周波数領域両耳聴モデル / Frequency Domain Binaural Model
キーワード(2)（和/英）	話者識別 / Speaker Identification
キーワード(3)（和/英）	混合ガウスモデル / Gaussian Mixture Model
第 1 著者氏名（和/英）	清田佳偉 / Kai Kiyota
第 1 著者所属（和/英）	熊本大学(略称：熊本大) Kumamoto University(略称：Kumamoto Univ.)
第 2 著者氏名（和/英）	イルワンシャー / Irwansyah
第 2 著者所属（和/英）	熊本大学(略称：熊本大) Kumamoto University(略称：Kumamoto Univ.)
第 3 著者氏名（和/英）	松岡光祐 / Kousuke Matsuoka
第 3 著者所属（和/英）	熊本大学(略称：熊本大) Kumamoto University(略称：Kumamoto Univ.)
第 4 著者氏名（和/英）	宇佐川毅 / Tsuyoshi Usagawa
第 4 著者所属（和/英）	熊本大学(略称：熊本大) Kumamoto University(略称：Kumamoto Univ.)
発表年月日	2019-01-22
資料番号	EA2018-94
巻番号（vol）	vol.118
号番号（no）	EA-410
ページ範囲	pp.7-12(EA),
ページ数	6
発行日	2019-01-15 (EA)