大会名称
2020年 総合大会
大会コ-ド
2020G
開催年
2020
発行日
2020-03-03
セッション番号
D-14
セッション名
音声
講演日
2020/3/20
講演場所(会議室等)
総合科学部 K棟3F K310講義室
講演番号
D-14-7
タイトル
Generative Adversarial Networksを用いた半教師あり学習の音響イベント検出への適用
著者名
◎合馬一弥山田武志牧野昭二
キーワード
音響イベント検出, GAN, 半教師あり学習
抄録
音声アシスタントや自動運転車において,音響イベント検出(SED: Sound Event Detection)は重要な役割を担っている.SEDとは,与えられた音響データ内で発生している音響イベントの種類,開始時刻,終了時刻を特定することで ある.最近ではSEDを行う手法としてCNNやCRNNがよく用いられている.このようなNNを用いたSEDの学習には大量の強ラベル(音響イベントの種類,開始時刻,終了時刻からなるラベル)付きデータが必要であるが,高い検出精度を得るために必要な数百~数千のデータを用意するのは困難である.本稿では,ラベルなしデータを活用するために,Generative Adversarial Networksを用いた半教師あり学習手法をSEDに適用し,実験によりその有効性を示した.
本文pdf
PDF download   

PayPerView