講演名 2022-07-13
U-Netを用いた雑音除去と音声認識性能向上の検討
林 堅(神奈川工科大), 佐野 将太(神奈川工科大), 川喜田 佑介(神奈川工科大), 宮崎 剛(神奈川工科大), 田中 博(神奈川工科大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 雑音を含んだ音声を画像に変換し,雑音を除去する方法が提案されている.筆者らは電車内のアナウンスを聴覚に障害を持つ人に伝達するため,電車走行雑音を除去し,アナウンスを文字に変換することを試みている.従来の検討では,音声を画像に変換してU-Netによる雑音除去を行ったが,復元音声に歪が生じ,十分な性能が得られなかった.本検討では画像変換時のSTFTと学習モデル作成時のパラメータを調整し,最適なモデルを作成した.そして,車内アナウンスと想定した低SN比を含めた複数の異なるSN比の評価用データを用いて雑音除去を行った.モデルのロバスト性とともにその結果を音声認識エンジンに適用して音声認識性能の向上を確認した結果を示す.
抄録(英) A method for converting noisy sound into images to remove the noise has been proposed. We are attempting to remove train running noises and convert announcements into text in order to communicate train announcements to hearing disabilities. In the previous studies, the noise was removed by using U-Net with images converted from noisy sound. However, the quality of sound was not sufficient, since the restored sound was distorted. In this study, the optimal network model was built by adjusting conversion parameters of STFT and training parameters. The noise removal experiments from in-train announcements using data with multiple signal-to-noise ratios including low signal-to-noise ratios assuming in-train have been carried out. The recognition accuracy of noise-removed voice by voice recognition engine was improved, and the model with robustness could be built.
キーワード(和) スペクトログラム / ノイズ除去 / U-Net / 電車走行音 / ロバスト性 / 音声認識
キーワード(英) Spectrum / Noise Removal / U-Net / Train Running Noise / Robustness / Voice Recognition
資料番号 SeMI2022-26
発行日 2022-07-06 (SeMI)

研究会情報
研究会 NS / SR / RCS / SeMI / RCC
開催期間 2022/7/13(から3日開催)
開催地(和) 金沢歌劇座 + オンライン開催
開催地(英) The Kanazawa Theatre + Online
テーマ(和) 無線分散ネットワーク,M2M(Machine-to-Machine),D2D(Device-to-Device),一般
テーマ(英) Distributed Wireless Network, M2M (Machine-to-Machine),D2D (Device-to-Device),IoT(Internet of Things), etc
委員長氏名(和) 大石 哲矢(NTT) / 亀田 卓(広島大) / 樋口 健一(東京理科大) / 山本 高至(京大) / 東 俊一(名大)
委員長氏名(英) Tetsuya Oishi(NTT) / Suguru Kameda(Hiroshima Univ.) / Kenichi Higuchi(Tokyo Univ. of Science) / Koji Yamamoto(Kyoto Univ.) / Shunichi Azuma(Nagoya Univ.)
副委員長氏名(和) 三好 匠(芝浦工大) / 田久 修(信州大) / 石津 健太郎(NICT) / 矢野 一人(ATR) / 旦代 智哉(東芝) / 児島 史秀(NICT) / 牟田 修(九大) / 門田 和也(日立) / 大和田 泰伯(NICT) / 猿渡 俊介(阪大) / 小林 孝一(北大) / 石井 光治(香川大)
副委員長氏名(英) Takumi Miyoshi(Shibaura Insti of Tech.) / Osamu Takyu(Shinshu Univ.) / Kentaro Ishidu(NICT) / Kazuto Yano(ATR) / Tomoya Tandai(Toshiba) / Fumihide Kojima(NICT) / Osamu Muta(Kyushu Univ.) / Kazuya Monden(Hitachi) / Yasunori Owada(NICT) / Shunsuke Saruwatari(Osaka Univ.) / Shunichi Azuma(Hokkaido Univ.) / Koji Ishii(Kagawa Univ.)
幹事氏名(和) 池邉 隆(NTT) / 山口 実靖(工学院大) / 成枝 秀介(三重大) / 稲森 真美子(東海大) / 李 斗煥(NTT) / 山本 哲矢(パナソニック) / 安達 宏一(電通大) / 中村 理(シャープ) / 勝間田 優樹(NTTドコモ) / 中山 悠(東京農工大) / 内山 彰(阪大) / 加川 敏規(電中研) / 岡野 訓尚(立命館大)
幹事氏名(英) Takashi Ikebe(NTT) / Saneyasu Yamaguchi(Kogakuin Univ.) / Syusuke Narieda(Mie Univ.) / Mamiko Inamori(Tokai Univ.) / Doohwan Lee(NTT) / Tetsuya Yamamoto(Panasonic) / Koichi Adachi(Univ. of Electro-Comm) / Osamu Nakamura(Sharp) / Yuki Katsumata(NTT DOCOMO) / Yu Nakayama(Tokyo Univ. of Agri. and Tech.) / Akira Uchiyama(Osaka Univ.) / Toshinori Kagawa(CRIEPI) / Kunihisa Okano(Ritsumeikan Univ.)
幹事補佐氏名(和) 三原 孝太郎(NTT) / 大辻 太一(NEC) / 王 瀟岩(茨城大) / 田中 明美(MathWorks) / 須藤 克弥(電通大) / 酒井 学(三菱電機) / 岩渕 匡史(NTT) / 奥山 達樹(NTTドコモ) / 菅野 一生(KDDI総合研究所) / 張 裕淵(東工大) / 松田 裕貴(奈良先端大) / 田谷 昭仁(青学大) / 平井 健士(阪大) / 単 麟(NICT) / 足立 亮介(山口大)
幹事補佐氏名(英) Kotaro Mihara(NTT) / Taichi Ohtsuji(NEC) / WANG Xiaoyan(Ibaraki Univ.) / Akemi Tanaka(MathWorks) / Katsuya Suto(Univ. of Electro-Comm) / Manabu Sakai(Mitsubishi Electric) / Masashi Iwabuchi(NTT) / Tatsuki Okuyama(NTT DOCOMO) / Issei Kanno(KDDI Research) / Yuyuan Chang(Tokyo Inst. of Tech) / Yuki Matsuda(NAIST) / Akihito Taya(Aoyama Gakuin Univ.) / Takeshi Hirai(Osaka Univ.) / SHAN LIN(NICT) / Ryosuke Adachi(Yamaguchi Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Network Systems / Technical Committee on Smart Radio / Technical Committee on Radio Communication Systems / Technical Committee on Sensor Network and Mobile Intelligence / Technical Committee on Reliable Communication and Control
本文の言語 JPN
タイトル(和) U-Netを用いた雑音除去と音声認識性能向上の検討
サブタイトル(和) 電車走行雑音を対象として
タイトル(英) Investigation of noise removal using U-Net and voice recognition performance improvement
サブタイトル(和) for train running noise
キーワード(1)(和/英) スペクトログラム / Spectrum
キーワード(2)(和/英) ノイズ除去 / Noise Removal
キーワード(3)(和/英) U-Net / U-Net
キーワード(4)(和/英) 電車走行音 / Train Running Noise
キーワード(5)(和/英) ロバスト性 / Robustness
キーワード(6)(和/英) 音声認識 / Voice Recognition
第 1 著者 氏名(和/英) 林 堅 / Jian Lin
第 1 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 2 著者 氏名(和/英) 佐野 将太 / Shota Sano
第 2 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 3 著者 氏名(和/英) 川喜田 佑介 / Yuusuke Kawakita
第 3 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 4 著者 氏名(和/英) 宮崎 剛 / Tsuyoshi Miyazaki
第 4 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
第 5 著者 氏名(和/英) 田中 博 / Hiroshi Tanaka
第 5 著者 所属(和/英) 神奈川工科大学(略称:神奈川工科大)
Kanagawa Institute of Technology(略称:KAIT)
発表年月日 2022-07-13
資料番号 SeMI2022-26
巻番号(vol) vol.122
号番号(no) SeMI-108
ページ範囲 pp.34-39(SeMI),
ページ数 6
発行日 2022-07-06 (SeMI)