講演名 2018-11-22
[招待講演]音声強調における位相復元とアレイ処理への効果
若林 佑幸(首都大東京),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来の音声強調の研究において位相スペクトルを扱うことは一般的でなかったが,近年の位相スペクトルの音声品質や明瞭度に与える影響が見直されて以降,振幅スペクトルへの処理と併せて位相スペクトルに対する処理“位相復元” を考慮することが注目を集めている.特に音声の調波構造に注目した復元アプローチが音声強調に効果的であり,音声品質が改善することが報告されている.また,位相を復元することは音声強調だけでなく,チャネル位相差を用いるマイクロホンアレイ信号処理の性能改善にも効果が期待される.本原稿では,筆者がこれまでの報告で示した音声強調のための位相復元の方法と本手法による強調音声品質の評価実験を振り返るとともに,アレイ処理に適用したときの効果について評価する.評価実験によってPESQ などの客観指標の改善やリスニングテストを通した主観的な音声品質の改善がみられた.さらに代表的な音源定位手法MUSIC 法による推定空間スペクトルにおいて、本提案手法によってアレイ信号を強調することで,雑音によるスペクトルの疑似ピークが減衰し,真の空間スペクトルが推定できる可能性を確認した.
抄録(英) Phase spectrum processing for speech enhancement, so called ``phase reconstruction,'' has been particularly received attentions since latest works show the phase spectrum modification also improves speech quality and intelligibility just like amplitude spectrum modification though it was not general. Harmonic-structure-based phase reconstruction is known as an efficient approach for improving speech quality. In addition, estimating phase spectrum of multi-channel signals improves source localization performance in noisy environments because phase difference between the channels is a key of multi-channel processing. This paper reviews our works, the harmonic-structure-based phase reconstruction method for speech enhancement and its performance through experimental evaluation measuring speech quality, and evaluates an array processing performance. Experimental results showed the improvement on speech quality through objective measures such as PESQ and subjective listening test. Moreover, speech enhancement of multi-channel speeches with the proposed phase reconstruction method demonstrated that the pseudo peaks on the spatial spectrum with the MUSIC method are denoised and the true spatial spectrum is estimated.
キーワード(和) 音声強調 / 位相復元 / 調波構造 / 雑音除去 / MUSIC法
キーワード(英) speech enhancement / phase reconstruction / harmonic structure / noise reduction / MUSIC method
資料番号 EA2018-80,EMM2018-80
発行日 2018-11-14 (EA, EMM)

研究会情報
研究会 EA / ASJ-H / EMM / IPSJ-MUS
開催期間 2018/11/21(から2日開催)
開催地(和) ホテルこうしゅうえん(輪島市)
開催地(英) Hotel Koshuen
テーマ(和) <ビギナーズセッション>応用/電気音響,聴覚,音楽情報科学,コンテンツ処理,電子透かし,一般
テーマ(英) [Beginners Session] Engineering/Electro Acoustics, Psychological and Physiological Acoustics, Music and Computer, Content Processing, Digital Watermarking, and Related Topics
委員長氏名(和) 島内 末廣(金沢工大) / 小澤 賢司(山梨大) / 岩村 惠市(東京理科大) / 吉井 和佳(京大)
委員長氏名(英) Suehiro Shimauchi(Kanazawa Inst. of Tech.) / 小澤 賢司(山梨大) / Keiichi Iwamura(TUC) / 吉井 和佳(京大)
副委員長氏名(和) 古家 賢一(大分大) / 渡邉 貫治(秋田県立大) / 中川 誠司(千葉大) / 栗林 稔(岡山大) / 小嶋 徹也(東京高専)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Kanji Watanabe(Akita Pref. Univ.) / 中川 誠司(千葉大) / Minoru Kuribayashi(Okayama Univ.) / Tetsuya Kojima(NIT,Tokyo College)
幹事氏名(和) 武岡 成人(静岡理工科大) / 松井 健太郎(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事氏名(英) Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / Kentaro Matsui(NHK) / 山川 仁子(尚絅大) / 木谷 俊介(北陸先端大) / 大塚 翔(千葉大) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Tyukyo Univ.) / 齊藤 大輔(東大) / 竹川 佳成(はこだて未来大) / 中野 倫靖(産総研) / 松原 正樹(筑波大) / 伊藤 彰則(東北大)
幹事補佐氏名(和) 井本 桂右(立命館大) / 森川 大輔(富山県立大) / / 秋山 寛子(長野高専) / 金田 北洋(キヤノン)
幹事補佐氏名(英) Keisuke Imoto(Ritsumeikan Univ.) / Daisuke Morikawa(Toyama Pref Univ.) / / Hiroko Akiyama(NIT, Nagano College) / キタヒロ カネダ(CANON)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Auditory Research Meeting / Technical Committee on Enriched MultiMedia / Special Interest Group on Music and Computer
本文の言語 JPN
タイトル(和) [招待講演]音声強調における位相復元とアレイ処理への効果
サブタイトル(和)
タイトル(英) [Invited Talk] Phase reconstruction for speech enhancement and its effect on array processing
サブタイトル(和)
キーワード(1)(和/英) 音声強調 / speech enhancement
キーワード(2)(和/英) 位相復元 / phase reconstruction
キーワード(3)(和/英) 調波構造 / harmonic structure
キーワード(4)(和/英) 雑音除去 / noise reduction
キーワード(5)(和/英) MUSIC法 / MUSIC method
第 1 著者 氏名(和/英) 若林 佑幸 / Yukoh Wakabayashi
第 1 著者 所属(和/英) 首都大学東京(略称:首都大東京)
Tokyo Metropolitan University(略称:TMU)
発表年月日 2018-11-22
資料番号 EA2018-80,EMM2018-80
巻番号(vol) vol.118
号番号(no) EA-312,EMM-313
ページ範囲 pp.163-168(EA), pp.163-168(EMM),
ページ数 6
発行日 2018-11-14 (EA, EMM)