講演名 2016-08-25
複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善
岩野 公司(東京都市大), 荒毛 祐紀(東京都市大), 小平 優希(東京都市大), 篠田 浩一(東工大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,会話や会議の参加者が各自の所有するスマートフォンで音声を収録することで集められた,複数の多人数会話音声の処理技術として,「対話グループ検出」と「話者決定」について論じる.先行研究で提案した対話グループ検出は,グループ数が既知であることを前提とした手法であったため,本研究ではその改善手法として,ベイズ情報量基準に基づくグループ数推定機能を有する対話グループ検出手法の提案を行う.また,クラスタリング手法の改良による性能改善も試みる.話者決定については,従来の提案手法では性能が6割に満たなかったため,相互スペクトル減算によって発話重畳の影響を抑制した話者決定手法の提案を行い,性能の向上を試みる.対話グループ検出については,15グループ60会話音声データを使用した実験の結果,正しくグループ数が推定され,グループ検出性能も100%に達することが確認された.話者決定手法については,5セッションの雑談音声データを利用した評価により,従来手法よりも約6%の性能改善が確認され,提案手法の有効性が示された.
抄録(英)
キーワード(和) 多人数会話 / 対話グループ検出 / 話者決定 / スマートフォン
キーワード(英)
資料番号 SP2016-37
発行日 2016-08-17 (SP)

研究会情報
研究会 SP
開催期間 2016/8/24(から2日開催)
開催地(和) 京都大学学術情報メディアセンター
開催地(英) ACCMS, Kyoto Univ.
テーマ(和) 音響イベント処理,一般
テーマ(英) Audio event processing, etc.
委員長氏名(和) 間野 一則(芝浦工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech
本文の言語 JPN-ONLY
タイトル(和) 複数スマートフォンで収録された会話音声の対話グループ検出と話者決定の性能改善
サブタイトル(和)
タイトル(英)
サブタイトル(和)
キーワード(1)(和/英) 多人数会話
キーワード(2)(和/英) 対話グループ検出
キーワード(3)(和/英) 話者決定
キーワード(4)(和/英) スマートフォン
第 1 著者 氏名(和/英) 岩野 公司 / Koji Iwano
第 1 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
第 2 著者 氏名(和/英) 荒毛 祐紀 / Yuki Arake
第 2 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
第 3 著者 氏名(和/英) 小平 優希 / Yuki Kodaira
第 3 著者 所属(和/英) 東京都市大学(略称:東京都市大)
Tokyo City University(略称:Tokyo City Univ.)
第 4 著者 氏名(和/英) 篠田 浩一 / Koichi Shinoda
第 4 著者 所属(和/英) 東京工業大学(略称:東工大)
Tokyo Institute of Technology(略称:TokyoTech)
発表年月日 2016-08-25
資料番号 SP2016-37
巻番号(vol) vol.116
号番号(no) SP-189
ページ範囲 pp.53-58(SP),
ページ数 6
発行日 2016-08-17 (SP)