Generative Adversarial Networksを用いた半教師あり学習の音響イベント検出への適用

◎合馬一弥; 山田武志; 牧野昭二

大会名称
2020年総合大会
大会コ－ド
2020G
開催年
2020
発行日
2020-03-03
セッション番号
D-14
セッション名
音声
講演日
2020/3/20
講演場所(会議室等)
総合科学部 K棟３F　K310講義室
講演番号
D-14-7
タイトル
Generative Adversarial Networksを用いた半教師あり学習の音響イベント検出への適用
著者名
◎合馬一弥, 山田武志, 牧野昭二,
キーワード
音響イベント検出, GAN, 半教師あり学習
抄録
音声アシスタントや自動運転車において，音響イベント検出(SED: Sound Event Detection)は重要な役割を担っている．SEDとは，与えられた音響データ内で発生している音響イベントの種類，開始時刻，終了時刻を特定することである．最近ではSEDを行う手法としてCNNやCRNNがよく用いられている．このようなNNを用いたSEDの学習には大量の強ラベル(音響イベントの種類，開始時刻，終了時刻からなるラベル)付きデータが必要であるが，高い検出精度を得るために必要な数百～数千のデータを用意するのは困難である．本稿では，ラベルなしデータを活用するために，Generative Adversarial Networksを用いた半教師あり学習手法をSEDに適用し，実験によりその有効性を示した．
本文pdf
PDF download PayPerView