［ポスター講演］MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調

山岡 洸瑛; 小野 順貴; 牧野 昭二; 山田 武志

講演名	2019-03-14 ［ポスター講演］MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調山岡洸瑛(筑波大), 小野順貴(首都大東京), 牧野昭二(筑波大), 山田武志(筑波大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本稿では，ステレオマイクロフォンから利用可能な新たな劣決定音声強調手法を提案する．我々は以前，時間周波数点毎に事前構成した複数のビームフォーマを切り替えて音声強調を行う時間周波数スイッチング (time-frequency-bin-wise switching; TFS) ビームフォーマを提案した．しかし，TFS ビームフォーマは劣決定系において高い音声強調性能を示す一方で，目的音源および存在するそれぞれの干渉音源の事前情報を用いて複数のビームフォーマのフィルタ係数を事前に推定する必要があり，実環境における使用に制限があった．本稿では，この問題を解決するため，ビームフォーマの構成と切り替えを同時最適化問題として再定式化し，それを解く新たなアルゴリズムを提案する．提案するアルゴリズムは，時間周波数点毎に最も支配的な音源のクラスタリングとその点を用いた最小分散無歪応答(minimum variance distortionless response; MVDR) ビームフォーマの構成という2つのステップにより音声強調を行っていると解釈することができる．実験では，干渉音の方向によらず，従来の時間周波数マスキングやMVDR ビームフォーマを上回る音声強調性能を達成することを確認した．
抄録(英)	In this paper, we present an underdetermined speech enhancement method called the time-frequency-bin-wise switching beamformer. In this method, we switch multiple preconstructed beamformers in each time-frequency (TF) bin, each of which suppresses a particular interferer. However, this method requires the target-active period and interferer-wise-active periods as the prior information. In this paper, to overcome this limitation, we formulate the switching and construction of beamformers as a joint optimization problem, which can be understood from two viewpoints: the clustering of the most dominant interferer signal in each TF bin and the construction of MVDR beamformers using such bins.
キーワード(和)	ビームフォーミング / 時間周波数点マスキング / 劣決定問題 / 音声強調 / 非線形信号処理
キーワード(英)	beamforming / time-frequency masking / underdetermined situation / speech enhancement / nonlinear signal processing
資料番号	EA2018-124,SIP2018-130,SP2018-86
発行日	2019-03-07 (EA, SIP, SP)

研究会情報
研究会	EA / SIP / SP
開催期間	2019/3/14(から2日開催)
開催地（和）	アイランドナガサキ（長崎市）
開催地（英）	i+Land nagasaki (Nagasaki-shi)
テーマ（和）	応用／電気音響，信号処理，音声，一般
テーマ（英）	Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics
委員長氏名（和）	島内末廣(金沢工大) / 村松正吾(新潟大) / 山下洋一(立命館大)
委員長氏名（英）	Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shogo Muramatsu(Niigata Univ.) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名（和）	古家賢一(大分大) / 渡邉貫治(秋田県立大) / 相川直幸(東京理科大) / 林和則(阪市大) / 李晃伸(名工大)
副委員長氏名（英）	Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Naoyuki Aikawa(TUS) / Kazunori Hayashi(Osaka City Univ) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名（和）	武岡成人(静岡理工科大) / 松井健太郎(NHK) / 渡邊修(拓殖大) / 中本昌由(広島大学) / 南條浩輝(京大) / 坂野秀樹(名城大)
幹事氏名（英）	Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Osamu Watanabe(Takushoku Univ.) / Masayoshi Nakamoto(Hiroshima Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名（和）	井本桂右(立命館大) / 森川大輔(富山県立大) / 小西克巳(法政大) / 何宜欣(拓殖大) / 郡山知樹(東工大) / 小橋川哲(NTT)
幹事補佐氏名（英）	Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Katsumi Konishi(Hosei Univ.) / hyihsin(Takushoku Univ.) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech
本文の言語	JPN
タイトル（和）	［ポスター講演］MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調
サブタイトル（和）
タイトル（英）	[Poster Presentation] MVDR beamformer based on time-frequency-bin-wise switching technique for underdetermined speech enhancement
サブタイトル（和）
キーワード(1)（和/英）	ビームフォーミング / beamforming
キーワード(2)（和/英）	時間周波数点マスキング / time-frequency masking
キーワード(3)（和/英）	劣決定問題 / underdetermined situation
キーワード(4)（和/英）	音声強調 / speech enhancement
キーワード(5)（和/英）	非線形信号処理 / nonlinear signal processing
第 1 著者氏名（和/英）	山岡洸瑛 / Kouei Yamaoka
第 1 著者所属（和/英）	筑波大学(略称：筑波大) University of Tsukuba(略称：Univ. of Tsukuba)
第 2 著者氏名（和/英）	小野順貴 / Nobutaka Ono
第 2 著者所属（和/英）	首都大学東京(略称：首都大東京) Tokyo Metropolitan University(略称：Tokyo Metropolitan Univ.)
第 3 著者氏名（和/英）	牧野昭二 / Shoji Makino
第 3 著者所属（和/英）	筑波大学(略称：筑波大) University of Tsukuba(略称：Univ. of Tsukuba)
第 4 著者氏名（和/英）	山田武志 / Takeshi Yamada
第 4 著者所属（和/英）	筑波大学(略称：筑波大) University of Tsukuba(略称：Univ. of Tsukuba)
発表年月日	2019-03-14
資料番号	EA2018-124,SIP2018-130,SP2018-86
巻番号（vol）	vol.118
号番号（no）	EA-495,SIP-496,SP-497
ページ範囲	pp.149-154(EA), pp.149-154(SIP), pp.149-154(SP),
ページ数	6
発行日	2019-03-07 (EA, SIP, SP)