講演名 2017-03-01
光マイクロホンを用いた深層ニューラルネットワークに基づく騒音下音声復元
水野 智之(立命館大), 福森 隆寛(立命館大), 中山 雅人(立命館大), 西浦 敬信(立命館大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 遠隔発話音声の受音は, セキュリティや監視を目的としたシステムに有用である. また, 遠方で発生した音の観測を目的として様々なマイクロホンが開発されており, パラボラ型マイクロホンやガンマイクロホンなどが挙げられる. しかし, このようなマイクロホンは, 周囲が騒がしい環境において目的音声のみを計測することが困難である. そこで本稿では, レーザ光を利用した音響計測システムである光マイクロホンに着目する. 光マイクロホンの一つであるレーザドップラ振動計は, 音声によって振動している発話者付近の薄膜上の物体にレーザ光を照射し遠隔発話音声を得る. しかし, 強く張られていない薄膜状の物体は高周波数の振動が発生しにくいため, 遠隔発話音声は高域が欠落した状態で受音される. 本稿では, 深層ニューラルネットワーク(Deep Neural Network, DNN)を用いた観測音声の復元手法を光マイクロホンの観測音声に適用し, 性能改善を試みる. DNNの入力には複素スペクトルを用いて学習を実施する. 最後に, 評価実験にて提案システムによる出力音声の音質を評価し, 提案システムの有効性を確認する.
抄録(英) Measuring distant-talking speech with high accuracy is important for detecting criminal activity. Various microphones such as the parabolic and shotgun microphones have been developed for measuring it. However, most of them have difficulty in extracting distant-talking speech at a target position if they are surrounded by noisy sound sources. Therefore, this study focuses on an optical microphone which uses a laser light for extracting the distant-talking speech. The optical microphone is realized by a laser doppler vibrometer. The sound quality of the optical microphone is especially degraded at higher frequencies because it utilizes an external diaphragm consisting of various materials as the vibrating papery object. In this study, we therefore propose a reconstruction method with a deep neural network that uses a complex spectrum as an input signal. Finally, we confirmed the effectiveness of the proposed system through an evaluation experiment.
キーワード(和) 光マイクロホン / 音声復元 / 深層ニューラルネットワーク / レーザドップラ振動計 / 複素スペクトル
キーワード(英) Optical microphone / Speech reconstruction / Deep neural network / Laser doppler vibrometer / Complex spectrum
資料番号 EA2016-84,SIP2016-139,SP2016-79
発行日 2017-02-22 (EA, SIP, SP)

研究会情報
研究会 SP / SIP / EA
開催期間 2017/3/1(から2日開催)
開催地(和) 沖縄産業支援センター
開催地(英) Okinawa Industry Support Center
テーマ(和) 音声,応用/電気音響,信号処理,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, and Related Topics
委員長氏名(和) 間野 一則(芝浦工大) / 中静 真(千葉工大) / 水町 光徳(九工大)
委員長氏名(英) Kazunori Mano(Shibaura Inst. of Tech.) / Makoto Nakashizuka(Chiba Inst. of Tech.) / Mitsunori Mizumachi(Kyushu Inst. of Tech.)
副委員長氏名(和) 森 大毅(宇都宮大) / 奥田 正浩(北九州市大) / 村松 正吾(新潟大) / 羽田 陽一(電通大) / 島内 末廣(NTT)
副委員長氏名(英) Hiroki Mori(Utsunomiya Univ.) / Masahiro Okuda(Univ. of Kitakyushu) / Shogo Muramatsu(Niigata Univ.) / Yoichi Haneda(Univ. of Electro-Comm.) / Suehiro Shimauchi(NTT)
幹事氏名(和) 滝口 哲也(神戸大) / 西田 昌史(静岡大) / 平林 晃(立命館大) / 宮田 高道(千葉工大) / 堀内 俊治(KDDI研) / 渡邉 貫治(秋田県立大)
幹事氏名(英) Tetsuya Takiguchi(Kobe Univ.) / Masafumi Nishida(Shizuoka Univ.) / Akira Hirabayashi(Ritsumeikan Univ.) / Takamichi Miyata(Chiba Inst. of Tech.) / Toshiharu Horiuchi(KDDI R&D Labs.) / Kanji Watanabe(Akita Pref. Univ.)
幹事補佐氏名(和) 浅見 太一(NTT) / 橋本 佳(名工大) / 渡邊 修(拓殖大) / 武岡 成人(静岡理工科大) / TREVINO Jorge(東北大)
幹事補佐氏名(英) Taichi Asami(NTT) / Kei Hashimoto(Nagoya Inst. of Tech.) / Osamu Watanabe(Takushoku Univ.) / Shigeto Takeoka(Shizuoka Inst. of Science and Tech.) / TREVINO Jorge(Tohoku Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Speech / Technical Committee on Signal Processing / Technical Committee on Engineering Acoustics
本文の言語 JPN
タイトル(和) 光マイクロホンを用いた深層ニューラルネットワークに基づく騒音下音声復元
サブタイトル(和)
タイトル(英) Noisy speech reconstruction based on deep neural network with optical microphone
サブタイトル(和)
キーワード(1)(和/英) 光マイクロホン / Optical microphone
キーワード(2)(和/英) 音声復元 / Speech reconstruction
キーワード(3)(和/英) 深層ニューラルネットワーク / Deep neural network
キーワード(4)(和/英) レーザドップラ振動計 / Laser doppler vibrometer
キーワード(5)(和/英) 複素スペクトル / Complex spectrum
第 1 著者 氏名(和/英) 水野 智之 / Tomoyuki Mizuno
第 1 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 2 著者 氏名(和/英) 福森 隆寛 / Takahiro Fukumori
第 2 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 3 著者 氏名(和/英) 中山 雅人 / Masato Nakayama
第 3 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 4 著者 氏名(和/英) 西浦 敬信 / Takanobu Nishiura
第 4 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
発表年月日 2017-03-01
資料番号 EA2016-84,SIP2016-139,SP2016-79
巻番号(vol) vol.116
号番号(no) EA-475,SIP-476,SP-477
ページ範囲 pp.13-18(EA), pp.13-18(SIP), pp.13-18(SP),
ページ数 6
発行日 2017-02-22 (EA, SIP, SP)