講演名 | 2018-01-29 マイクロホンアレイにより得た時空間音圧分布画像の復元に関する考察 小澤 賢司(山梨大), 伊藤 将亮(山梨大), 清水 源也(山梨大), 瀧澤 恵里(山梨大), 森勢 将雅(山梨大), 坂本 修一(東北大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究プロジェクトでは,マイクロホンアレイからの出力を時空間音圧分布画像に変換し,2次元高速フーリエ変換 (2D-FFT)を利用することで高精度な音源分離を達成することを目的としている。正面から到来した目的音は,時空間音圧分布画像では縦縞を構成するので,2D-FFTにおいては縦方向の直流成分に局在する。そこで,斜め方向から到来した雑音に含まれる空間波形としての直流成分の振幅をニューラルネットワークにより推定し,スペクトルサブトラクションを行うことで雑音抑制を行った。その結果,長さ14 cm のアレイにより,遅延和アレイで80 cm相当の雑音抑制効果を得た。また,マイクロホンが疎に配置されたアレイ出力から,密に配置された場合の時空間音圧分布画像の復元を試みた。その結果,電話音声帯域では十分な性能が得られることが示唆された。 |
抄録(英) | This project aims to achieve sound source separation by two-dimensional fast Fourier transform (2D-FFT) of a spatio-temporal sound pressure distribution image that is composed from the outputs of a microphone array. A target sound that arrives from the front of the array forms a vittate image and thus it appears as direct current (DC) components in the vertical direction in the 2D-FFT spectrum. Noise suppression was intended by the spectral subtraction, in which the noise DC components were estimated in the spectrum by artificial neural networks. As a result, the proposed array processing method with 14-cm length array achieved the comparable performance of a conventional delay and sum beamformer with an approximately 80-cm length array. The restoration of a spatio-temporal sound pressure distribution image of an array with densely spaced microphones was attempted using the image from an array with sparsely spaced microphones. The results suggest that a sufficient performance can be obtained for the telephone speech frequency band. |
キーワード(和) | $mu^2$ホンアレイ / 時空間音圧分布画像 / 画像信号処理 / 2次元高速フーリエ変換 / 音源分離 |
キーワード(英) | Micro-spaced microphone array / Spatio-temporal sound pressure distribution image / Image signal processing / Two-dimensional FFT / Sound source separation |
資料番号 | EMM2017-66 |
発行日 | 2018-01-22 (EMM) |
研究会情報 | |
研究会 | EMM |
---|---|
開催期間 | 2018/1/29(から2日開催) |
開催地(和) | 東北大学 青葉山キャンパス |
開催地(英) | Tohoku Univ. (Aobayama Campus) |
テーマ(和) | 臨場感生成,ユニバーサルメディア,ディジタルエンタテインメント,一般 |
テーマ(英) | Sense of Presence, Universal Media, Digital Entertainment, etc. |
委員長氏名(和) | 岩村 惠市(東京理科大) |
委員長氏名(英) | Keiichi Iwamura(TUS) |
副委員長氏名(和) | 日置 尋久(京大) / 栗林 稔(岡山大) |
副委員長氏名(英) | Hirohisa Hioki(Kyoto Univ.) / Minoru Kuribayashi(Okayama Univ.) |
幹事氏名(和) | 生源寺 類(静岡大) / 藤吉 正明(首都大東京) |
幹事氏名(英) | Rui Shogenji(Shizuoka Univ.) / Masaaki Fujiyoshi(Tokyo Metro. Univ.) |
幹事補佐氏名(和) | 姜 玄浩(東京高専) / 村田 晴美(中京大) |
幹事補佐氏名(英) | Kan Hyonho(NIT, Tokyo) / Harumi Murata(Chukyo Univ.) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Enriched MultiMedia |
---|---|
本文の言語 | JPN |
タイトル(和) | マイクロホンアレイにより得た時空間音圧分布画像の復元に関する考察 |
サブタイトル(和) | |
タイトル(英) | Study on restoration of a spatio-temporal sound pressure distribution image obtained with a microphone array |
サブタイトル(和) | |
キーワード(1)(和/英) | $mu^2$ホンアレイ / Micro-spaced microphone array |
キーワード(2)(和/英) | 時空間音圧分布画像 / Spatio-temporal sound pressure distribution image |
キーワード(3)(和/英) | 画像信号処理 / Image signal processing |
キーワード(4)(和/英) | 2次元高速フーリエ変換 / Two-dimensional FFT |
キーワード(5)(和/英) | 音源分離 / Sound source separation |
第 1 著者 氏名(和/英) | 小澤 賢司 / Kenji Ozawa |
第 1 著者 所属(和/英) | 山梨大学(略称:山梨大) University of Yamanashi(略称:Univ. Yamanashi) |
第 2 著者 氏名(和/英) | 伊藤 将亮 / Masaaki Ito |
第 2 著者 所属(和/英) | 山梨大学(略称:山梨大) University of Yamanashi(略称:Univ. Yamanashi) |
第 3 著者 氏名(和/英) | 清水 源也 / Genya Shimizu |
第 3 著者 所属(和/英) | 山梨大学(略称:山梨大) University of Yamanashi(略称:Univ. Yamanashi) |
第 4 著者 氏名(和/英) | 瀧澤 恵里 / Eri Takizawa |
第 4 著者 所属(和/英) | 山梨大学(略称:山梨大) University of Yamanashi(略称:Univ. Yamanashi) |
第 5 著者 氏名(和/英) | 森勢 将雅 / Masanori Morise |
第 5 著者 所属(和/英) | 山梨大学(略称:山梨大) University of Yamanashi(略称:Univ. Yamanashi) |
第 6 著者 氏名(和/英) | 坂本 修一 / Shuichi Sakamoto |
第 6 著者 所属(和/英) | 東北大学(略称:東北大) Tohoku University(略称:Tohoku Univ.) |
発表年月日 | 2018-01-29 |
資料番号 | EMM2017-66 |
巻番号(vol) | vol.117 |
号番号(no) | EMM-425 |
ページ範囲 | pp.1-6(EMM), |
ページ数 | 6 |
発行日 | 2018-01-22 (EMM) |