講演名 | 2019-03-14 [ポスター講演]MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調 山岡 洸瑛(筑波大), 小野 順貴(首都大東京), 牧野 昭二(筑波大), 山田 武志(筑波大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本稿では,ステレオマイクロフォンから利用可能な新たな劣決定音声強調手法を提案する.我々は以前,時間周波数点毎に事前構成した複数のビームフォーマを切り替えて音声強調を行う時間周波数スイッチング (time-frequency-bin-wise switching; TFS) ビームフォーマを提案した.しかし,TFS ビームフォーマは劣決定系において高い音声強調性能を示す一方で,目的音源および存在するそれぞれの干渉音源の事前情報を用いて複数のビームフォーマのフィルタ係数を事前に推定する必要があり,実環境における使用に制限があった.本稿では,この問題を解決するため,ビームフォーマの構成と切り替えを同時最適化問題として再定式化し,それを解く新たなアルゴリズムを提案する.提案するアルゴリズムは,時間周波数点毎に最も支配的な音源のクラスタリングとその点を用いた最小分散無歪応答(minimum variance distortionless response; MVDR) ビームフォーマの構成という2つのステップにより音声強調を行っていると解釈することができる.実験では,干渉音の方向によらず,従来の時間周波数マスキングやMVDR ビームフォーマを上回る音声強調性能を達成することを確認した. |
抄録(英) | In this paper, we present an underdetermined speech enhancement method called the time-frequency-bin-wise switching beamformer. In this method, we switch multiple preconstructed beamformers in each time-frequency (TF) bin, each of which suppresses a particular interferer. However, this method requires the target-active period and interferer-wise-active periods as the prior information. In this paper, to overcome this limitation, we formulate the switching and construction of beamformers as a joint optimization problem, which can be understood from two viewpoints: the clustering of the most dominant interferer signal in each TF bin and the construction of MVDR beamformers using such bins. |
キーワード(和) | ビームフォーミング / 時間周波数点マスキング / 劣決定問題 / 音声強調 / 非線形信号処理 |
キーワード(英) | beamforming / time-frequency masking / underdetermined situation / speech enhancement / nonlinear signal processing |
資料番号 | EA2018-124,SIP2018-130,SP2018-86 |
発行日 | 2019-03-07 (EA, SIP, SP) |
研究会情報 | |
研究会 | EA / SIP / SP |
---|---|
開催期間 | 2019/3/14(から2日開催) |
開催地(和) | アイランド ナガサキ(長崎市) |
開催地(英) | i+Land nagasaki (Nagasaki-shi) |
テーマ(和) | 応用/電気音響,信号処理,音声,一般 |
テーマ(英) | Engineering/Electro Acoustics, Signal Processing, Speech, and Related Topics |
委員長氏名(和) | 島内 末廣(金沢工大) / 村松 正吾(新潟大) / 山下 洋一(立命館大) |
委員長氏名(英) | Suehiro Shimauchi(Kanazawa Inst. of Tech.) / Shogo Muramatsu(Niigata Univ.) / Yoichi Yamashita(Ritsumeikan Univ.) |
副委員長氏名(和) | 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 相川 直幸(東京理科大) / 林 和則(阪市大) / 李 晃伸(名工大) |
副委員長氏名(英) | Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / Naoyuki Aikawa(TUS) / Kazunori Hayashi(Osaka City Univ) / Akinobu Ri(Nagoya Inst. of Tech.) |
幹事氏名(和) | 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 渡邊 修(拓殖大) / 中本 昌由(広島大学) / 南條 浩輝(京大) / 坂野 秀樹(名城大) |
幹事氏名(英) | Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / Osamu Watanabe(Takushoku Univ.) / Masayoshi Nakamoto(Hiroshima Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.) |
幹事補佐氏名(和) | 井本 桂右(立命館大) / 森川 大輔(富山県立大) / 小西 克巳(法政大) / 何 宜欣(拓殖大) / 郡山 知樹(東工大) / 小橋川 哲(NTT) |
幹事補佐氏名(英) | Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / Katsumi Konishi(Hosei Univ.) / hyihsin(Takushoku Univ.) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech |
---|---|
本文の言語 | JPN |
タイトル(和) | [ポスター講演]MVDRビームフォーマの時間周波数スイッチングによる劣決定音声強調 |
サブタイトル(和) | |
タイトル(英) | [Poster Presentation] MVDR beamformer based on time-frequency-bin-wise switching technique for underdetermined speech enhancement |
サブタイトル(和) | |
キーワード(1)(和/英) | ビームフォーミング / beamforming |
キーワード(2)(和/英) | 時間周波数点マスキング / time-frequency masking |
キーワード(3)(和/英) | 劣決定問題 / underdetermined situation |
キーワード(4)(和/英) | 音声強調 / speech enhancement |
キーワード(5)(和/英) | 非線形信号処理 / nonlinear signal processing |
第 1 著者 氏名(和/英) | 山岡 洸瑛 / Kouei Yamaoka |
第 1 著者 所属(和/英) | 筑波大学(略称:筑波大) University of Tsukuba(略称:Univ. of Tsukuba) |
第 2 著者 氏名(和/英) | 小野 順貴 / Nobutaka Ono |
第 2 著者 所属(和/英) | 首都大学東京(略称:首都大東京) Tokyo Metropolitan University(略称:Tokyo Metropolitan Univ.) |
第 3 著者 氏名(和/英) | 牧野 昭二 / Shoji Makino |
第 3 著者 所属(和/英) | 筑波大学(略称:筑波大) University of Tsukuba(略称:Univ. of Tsukuba) |
第 4 著者 氏名(和/英) | 山田 武志 / Takeshi Yamada |
第 4 著者 所属(和/英) | 筑波大学(略称:筑波大) University of Tsukuba(略称:Univ. of Tsukuba) |
発表年月日 | 2019-03-14 |
資料番号 | EA2018-124,SIP2018-130,SP2018-86 |
巻番号(vol) | vol.118 |
号番号(no) | EA-495,SIP-496,SP-497 |
ページ範囲 | pp.149-154(EA), pp.149-154(SIP), pp.149-154(SP), |
ページ数 | 6 |
発行日 | 2019-03-07 (EA, SIP, SP) |