講演名 2019-01-22
[ポスター講演]周波数領域両耳聴モデルを用いた複数話者同時発話時の話者識別に関する研究
清田 佳偉(熊本大), イルワンシャー(熊本大), 松岡 光祐(熊本大), 宇佐川 毅(熊本大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年,開発が進められている自動会議録作成支援システムでは,複数話者の発話が重畳したオーバラップ区間における,話者識別精度の低下が課題となっている.周波数領域両耳聴モデルは,人間の聴覚機能である音源分離機能をモデル化したものであり,同時発話理解への応用が期待される.本研究では,オーバラップ区間における精度改善を目的に周波数領域両耳聴モデルの利用を提案し,複数話者同時発話時における話者識別精度の評価を通して,その有用性について検討する.
抄録(英) In order to realize the speech recognition system suitable for a small meeting logging with speaker identification, it is required to segregate speakers based on the direction of arrival at the microphone system. In this study, we propose a meeting logging system using a binaural recording and Frequency Domain Binaural Model for segregation of concurrent speeches. Performance of speakers identification under multiple talkers condition is examined.
キーワード(和) 周波数領域両耳聴モデル / 話者識別 / 混合ガウスモデル
キーワード(英) Frequency Domain Binaural Model / Speaker Identification / Gaussian Mixture Model
資料番号 EA2018-94
発行日 2019-01-15 (EA)

研究会情報
研究会 EA / US
開催期間 2019/1/22(から2日開催)
開催地(和) 同志社大学
開催地(英) Doshisha Univ.
テーマ(和) <音響・超音波サブソサイエティ合同研究会>応用/電気音響,超音波,一般
テーマ(英) [Joint Meeting on Acoustics and Ultrasonics Subsociety] Engineering/Electro Acoustics, Ultrasonics, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 竹内 真一(桐蔭横浜大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shinichi Takeuchi(Toin Univ. of Yokohama)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 黒澤 実(東工大) / 近藤 淳(静岡大)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Minoru Kurosawa(Tokyo Inst. of Tech.) / Jun Kondo(Shizuoka Univ.)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 森田 剛(東大) / 土屋 健伸(神奈川大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Takeshi Morita(Univ. of Tokyo) / Takenobu Tsuchiya(Kanagawa Univ.)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 小山 大介(同志社大)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Daisuke Koyama(Doshisha Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Ultrasonics
本文の言語 JPN
タイトル(和) [ポスター講演]周波数領域両耳聴モデルを用いた複数話者同時発話時の話者識別に関する研究
サブタイトル(和)
タイトル(英) [Poster Presentation] On speaker identification under multiple-talker condition using frequency domain binaural model
サブタイトル(和)
キーワード(1)(和/英) 周波数領域両耳聴モデル / Frequency Domain Binaural Model
キーワード(2)(和/英) 話者識別 / Speaker Identification
キーワード(3)(和/英) 混合ガウスモデル / Gaussian Mixture Model
第 1 著者 氏名(和/英) 清田 佳偉 / Kai Kiyota
第 1 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 2 著者 氏名(和/英) イルワンシャー / Irwansyah
第 2 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 3 著者 氏名(和/英) 松岡 光祐 / Kousuke Matsuoka
第 3 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
第 4 著者 氏名(和/英) 宇佐川 毅 / Tsuyoshi Usagawa
第 4 著者 所属(和/英) 熊本大学(略称:熊本大)
Kumamoto University(略称:Kumamoto Univ.)
発表年月日 2019-01-22
資料番号 EA2018-94
巻番号(vol) vol.118
号番号(no) EA-410
ページ範囲 pp.7-12(EA),
ページ数 6
発行日 2019-01-15 (EA)