講演名 2022-03-02
[ポスター講演]クリッピング音声に対する叫び声検知の検討
石田 泰都(立命館大), 松田 和浩(立命館大), 福森 隆寛(立命館大), 山下 洋一(立命館大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 近年では,より安全な暮らしのために叫び声を利用した音響監視システムがいくつか提案されている. 従来の深層学習に基づく叫び声検知手法の多くは,クリーンな音声のみを学習に用いられている. しかし,実環境における音声は雑音環境やクリッピングによって劣化した状態で得られることが多い. そこで本稿では,クリッピングによって劣化した音声(クリッピング音声)に対して,マルチコンディション学習を用いた深層学習に基づく叫び声検知手法を検討する. 本研究では,学習データセットとして,クリッピングされていない原音声のみを用いた従来手法と,原音声とクリッピング音声を用いた提案手法,原音声とクリッピング音声を原音声に復元した音声(デクリッピング音声)を用いた提案手法の,3種類のデータセットによる叫び声検知手法を比較する. また,実環境を考慮し,雑音環境下における様々なクリッピング度合いの音声に対して,提案したマルチコンディション学習による手法の評価実験を行い,提案手法の有効性を検証した. 実験結果から,2種類の提案手法それぞれにおいて,クリッピングされていない音声のみで学習した従来手法よりも高い検知精度を達成した. 加えて,学習データセットに含まれないクリッピング度合いの音声に対しても,提案手法の有効性が確認できた.
抄録(英) Recently, several audio surveillance systems using shouted speech have been proposed for safety in daily life. Although only clean speech is used for training in conventional shout detection methods based on deep learning, noise in noisy environment and clipping distort target speech in real-world situations. This paper proposes a shout detection method based on deep learning with multi-condition learning for clipped speech. We compare the following three types of multi-condition learning: using only unclipped speech, using unclipped and clipped speech, and using unclipped and declipped speech. In this study, we evaluate the detection performance of clipped speech in various noisy environments. The results of experiments conducted in various noisy environments and clipping conditions demonstrate that proposed methods using multi-condition learning both better detection performance than the conventional method using only clean speech. In addition,results of experiments show that the proposed method can detect shouted speech with clipping ratios that is not included in training dataset.
キーワード(和) 叫び声 / 深層学習 / クリッピング音声 / クリッピング復元
キーワード(英) shout / deep learning / clipped speech / declipping
資料番号 EA2021-97,SIP2021-124,SP2021-82
発行日 2022-02-22 (EA, SIP, SP)

研究会情報
研究会 EA / SIP / SP / IPSJ-SLP
開催期間 2022/3/1(から2日開催)
開催地(和) 沖縄県立博物館・美術館
開催地(英)
テーマ(和) 応用/電気音響, 信号処理,音声,一般
テーマ(英)
委員長氏名(和) 梶川 嘉延(関西大) / 坂東 幸浩(NTT) / 北岡 教英(豊橋技科大) / 北岡 教英(豊橋技科大)
委員長氏名(英) Yoshinobu Kajikawa(Kansai Univ.) / Yukihiro Bandou(NTT) / Norihide Kitaoka(Toyohashi Univ. of Tec) / 北岡 教英(豊橋技科大)
副委員長氏名(和) 古家 賢一(大分大) / 小山 翔一(東大) / 田中 聡久(東京農工大) / 仲地 孝之(琉球大学)
副委員長氏名(英) Kenichi Furuya(Oita Univ.) / Shoichi Koyama(Univ. of Tokyo) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.) / Takayuki Nakachi(Ryukyu Univ.)
幹事氏名(和) 加古 達也(NTT) / 西浦 敬信(立命館大) / 杉本 憲治郎(Xiaomi) / 渡辺 修(拓殖大) / 田中 雄一(東京農工大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事氏名(英) Tatsuya Kako(NTT) / Takanobu Nishiura(RitsumeikanUniv.) / Kenjiro Sugimoto(Xiaomi) / Osamu Watanabe(Takushoku Univ.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Shinnosuke Takamichi(Univ. of Tokyo) / Ryouichi Takashima(Kobe Univ.) / 高道 慎之介(東大) / 高島 遼一(神戸大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(和) 若林 佑幸(都立大) / 小松 達也(LINE) / 吉田 太一(電通大) / 京地 清介(北九州市立大) / 中鹿 亘(電通大) / 増村 亮(NTT)
幹事補佐氏名(英) Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Taichi Yoshida(UEC) / Seisuke Kyochi(Univ. of Kitakyushu) / Toru Nakashika(Univ. of Electro-Comm.) / Ryo Masumura(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Signal Processing / Technical Committee on Speech / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) [ポスター講演]クリッピング音声に対する叫び声検知の検討
サブタイトル(和)
タイトル(英) [Poster Presentation] A study of shout detection for clipped speech
サブタイトル(和)
キーワード(1)(和/英) 叫び声 / shout
キーワード(2)(和/英) 深層学習 / deep learning
キーワード(3)(和/英) クリッピング音声 / clipped speech
キーワード(4)(和/英) クリッピング復元 / declipping
第 1 著者 氏名(和/英) 石田 泰都 / Taito Ishida
第 1 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 2 著者 氏名(和/英) 松田 和浩 / Kazuhiro Matsuda
第 2 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 3 著者 氏名(和/英) 福森 隆寛 / Takahiro Fukumori
第 3 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
第 4 著者 氏名(和/英) 山下 洋一 / Yoichi Yamashita
第 4 著者 所属(和/英) 立命館大学(略称:立命館大)
Ritsumeikan University(略称:Ritsumeikan Univ.)
発表年月日 2022-03-02
資料番号 EA2021-97,SIP2021-124,SP2021-82
巻番号(vol) vol.121
号番号(no) EA-383,SIP-384,SP-385
ページ範囲 pp.207-212(EA), pp.207-212(SIP), pp.207-212(SP),
ページ数 6
発行日 2022-02-22 (EA, SIP, SP)