講演名 2017-10-19
人狼プレイ録音音声のNMFベース任意話者音声強調
河野 秀祐(阪産大), 高橋 徹(阪産大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告では, 自由発話による複数話者の対話音声の発話強調について述べる. 自由発話による対話音声を録 音するために, 我々は, コミュニケーションゲームの一つである人狼プレイ中のプレイヤーの発話に着目する. 我々は, この方法で収集した音声を自由発話による複数話者の対話音声と位置付け分析対象とする. 次に, NMF を用いて特定 話者の音声を強調する方法を検討する. 録音音声中から特定話者の発話区間を求め, 特定話者の音響特徴量から基底ベ クトルを求める. その後, 複数話者が発話している対話音声全体を用いて特定話者の基底ベクトルを拡張する手法を提 案する. 特定話者の基底ベクトルは, その話者の特徴を表わしていると考えられる. この基底ベクトルの数を拡張する ときに, 拡張部分だけを学習する NMF 処理を行い, 拡張基底ベクトル部にノイズと他の話者の特徴を取得する. これ によりアクティベーション行列の要素は, 強調目標話者の基底に対応する行とノイズや他話者の基底に対応する行に 分けられる. 強調目標話者の基底のみから音響特徴を再構成し, 強調音声を得る方法である. 我々は 7 名による対話音 声に音声強調手法を適用したところ, 全ての話者が強調される傾向が示された. 特定話者のみの強調が困難であること が明かになった.
抄録(英) We describe that speech enhancement for natural and multi speaker dialognue. To record natural and multi speaker dialognue, we focus on utterances in the werewolf game JINRO which is one of the speech communication based card game. As we think that player’s utterance while they play with JINRO is natural, we record their dialognue and analyise it. We propose NMF based speech enhancement method to enhance one of the speakers. AfterselectingspeechsegmentofthetargetspeakerandanalysingbyNMF,his/hercharactoristicrepresentsasbase vectors. Multi speaker dialognue is analyised by NMF with the speaker’s base vectors and new base vectors. After all, noise’s and other speaker’s charactoristics are estimated in the new base vectors. The idea is that the given the speaker’s base vectors are ?xed in matrix factorization procedure. We can get activation matrix in which each line is divided into target speaker and the others. By using target speakers activities, we can synthesize enhanced speech. We conducted an experiment by 7 players, but the proposed method did not show good performance. The reason is that it is hard to get only the target speaker’s base vectors.
キーワード(和) 人狼 / 混合音 / 音源分離 / NMF
キーワード(英) Jinro / Mixed speech / Sound Source Separation / Nonnegative Matrix Factorization
資料番号 SP2017-35,WIT2017-31
発行日 2017-10-12 (SP, WIT)

研究会情報
研究会 WIT / SP
開催期間 2017/10/19(から2日開催)
開催地(和) 九工大戸畑図書館(北九州)
開催地(英) Tobata Library of Kyutech (Kitakyushu)
テーマ(和) 福祉情報工学と音声,一般
テーマ(英)
委員長氏名(和) 和田 親宗(九工大) / 山下 洋一(立命館大)
委員長氏名(英) Chikamune Wada(Kyushu Inst. of Tech.) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 若月 大輔(筑波技大) / 森 大毅(宇都宮大)
副委員長氏名(英) Daisuke Wakatsuki(Tsukuba Univ. of Tech.) / Hiroki Mori(Utsunomiya Univ.)
幹事氏名(和) 酒向 慎司(名工大) / 梶谷 勇(産総研) / 雨宮 智浩(NTT) / 西田 昌史(静岡大) / 坂野 秀樹(名城大)
幹事氏名(英) Shinji Sakou(Nagoya Inst. of Tech.) / Isamu Kajitani(AIST) / Tomohiro Amemiya(NTT) / Masafumi Nishida(Shizuoka Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 塩野目 剛亮(*) / 宮城 愛美(筑波技大) / 半田 隆志(埼玉県産技総合センター) / 橋本 佳(名工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Takeaki Shionome(*) / Manabi Miyagi(Tsukuba Univ. of Tech.) / Takashi Handa(Saitama Industrial Technology Center) / Kei Hashimoto(Nagoya Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Well-being Information Technology / Technical Committee on Speech
本文の言語 JPN
タイトル(和) 人狼プレイ録音音声のNMFベース任意話者音声強調
サブタイトル(和)
タイトル(英) Speech enhancement of utterance while playing with werewolf game "JINRO" based on NMF
サブタイトル(和)
キーワード(1)(和/英) 人狼 / Jinro
キーワード(2)(和/英) 混合音 / Mixed speech
キーワード(3)(和/英) 音源分離 / Sound Source Separation
キーワード(4)(和/英) NMF / Nonnegative Matrix Factorization
第 1 著者 氏名(和/英) 河野 秀祐 / Shunsuke Kawano
第 1 著者 所属(和/英) 大阪産業大学(略称:阪産大)
Osaka Sangyo University(略称:OSU)
第 2 著者 氏名(和/英) 高橋 徹 / Toru Takahashi
第 2 著者 所属(和/英) 大阪産業大学(略称:阪産大)
Osaka Sangyo University(略称:OSU)
発表年月日 2017-10-19
資料番号 SP2017-35,WIT2017-31
巻番号(vol) vol.117
号番号(no) SP-250,WIT-251
ページ範囲 pp.7-12(SP), pp.7-12(WIT),
ページ数 6
発行日 2017-10-12 (SP, WIT)