講演名 2023-11-16
互いにオーバーラップする楽曲イベントの分離を目的とした物体検出に基づく音楽検出手法の検討
北山 昌希(博報堂テクノロジーズ), 大西 一貫(博報堂テクノロジーズ),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 音声コンテンツ中で使用されしばしばオーバーラップを伴う個別の楽曲イベントの検出のために,物体検出の枠組みに基づく楽曲イベント区間の検出を検討する.実現が困難であったオーバーラップを伴う楽曲イベ ントを分離する形での検出において,コンピュータービジョンにおける物体検出の枠組みにより楽曲イベント区間を直接的に回帰することで実現している.物体検出手法であるFaster R-CNNをベースとした楽曲検出モデルに対し,商用利用されている音声コンテンツを想定したDJミックスによるシミュレーションデータを用いた評価を行なう.現在商用利用されている音声コンテンツに対し,より高度な分析/コンテンツ制作に寄与する技術の基礎となるものである.
抄録(英) We consider the music event detection which is based on the framework of object detection, for detecting individual music events that often overlap with each other in audio contents. Conventional music detection methods which perform frame-level classification have difficulty in detecting individual music events that overlap with each other. Since the object detection framework in computer vision directly regresses event intervals, these overlapping events can be individually detected at the event-level. We propose a music detection model based on Faster R-CNN, an object detection method, and evaluate it on a dataset simulating DJ mixing techniques, assuming commercial audio contents. This study will form the basis of technology that will contribute to more advanced analysis and content production for audio content currently in commercial use.
キーワード(和) 音響イベント検出 / 音楽検出 / 物体検出 / Faster R-CNN / イベントレベル検出
キーワード(英) Audio event detection / Music detection / Object detection / Faster R-CNN / Event-level detection
資料番号 PRMU2023-22
発行日 2023-11-09 (PRMU)

研究会情報
研究会 PRMU / IPSJ-CVIM / IPSJ-DCC / IPSJ-CGVI
開催期間 2023/11/16(から2日開催)
開催地(和) 鳥取県立生涯学習センター(県民ふれあい会館)
開催地(英)
テーマ(和) 人を表現・理解するためのCG/DCC/CV/PR技術
テーマ(英)
委員長氏名(和) 柏野 邦夫(NTT)
委員長氏名(英) Kunio Kashio(NTT)
副委員長氏名(和) 舩冨 卓哉(奈良先端大) / 入江 豪(東京理科大)
副委員長氏名(英) Takuya Funatomi(NAIST) / Go Irie(Tokyo Univ. of Science)
幹事氏名(和) 井上 中順(東工大) / 川西 康友(理研)
幹事氏名(英) Nakamasa Inoue(Tokyo Inst. of Tech.) / Yasutomo Kawanishi(Riken)
幹事補佐氏名(和) 下西 慶(京大) / 原 健翔(産総研)
幹事補佐氏名(英) Kei Shimonishi(Kyoto Univ.) / Kensho Hara(AIST)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Special Interest Group on Computer Vision and Image Media / Special Interest Group on Digital Contents Creation / Special Interest Group on Computer Graphics and Visual Informatics
本文の言語 JPN
タイトル(和) 互いにオーバーラップする楽曲イベントの分離を目的とした物体検出に基づく音楽検出手法の検討
サブタイトル(和)
タイトル(英) A consideration of a music detection method based on object detection for separating music events that overlap with each other
サブタイトル(和)
キーワード(1)(和/英) 音響イベント検出 / Audio event detection
キーワード(2)(和/英) 音楽検出 / Music detection
キーワード(3)(和/英) 物体検出 / Object detection
キーワード(4)(和/英) Faster R-CNN / Faster R-CNN
キーワード(5)(和/英) イベントレベル検出 / Event-level detection
第 1 著者 氏名(和/英) 北山 昌希 / Masaki Kitayama
第 1 著者 所属(和/英) 株式会社博報堂テクノロジーズ(略称:博報堂テクノロジーズ)
Hakuhodo Technologies Inc.(略称:Hakuhodo Technologies)
第 2 著者 氏名(和/英) 大西 一貫 / Kazuhiro Onishi
第 2 著者 所属(和/英) 株式会社博報堂テクノロジーズ(略称:博報堂テクノロジーズ)
Hakuhodo Technologies Inc.(略称:Hakuhodo Technologies)
発表年月日 2023-11-16
資料番号 PRMU2023-22
巻番号(vol) vol.123
号番号(no) PRMU-266
ページ範囲 pp.37-42(PRMU),
ページ数 6
発行日 2023-11-09 (PRMU)