講演名 2021-03-03
[ポスター講演]画像内の物体検出に基づくサウンドスケープ自動生成システムの課題
苣木 禎史(千葉工大), 堀内 俊治(KDDI総合研究所),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,音の無い動画や静止画にサウンドスケープを付与するために,画像を分析し,音像を適切に制御し,オブジェクトの軌道推定,さらには音源オブジェクト間のミキシングを視覚情報と調和するように自動的にミキシングまで行うことを目指す。本稿では,サウンドスケープ自動生成システムの設計と課題について述べる。
抄録(英) This study describes automatic soundscape generation process for non-audio movie and photo. The processes consists of image analysis using machine learning, estimation of direction and relative distance for objects from a image, orbit estimation of objects and mixing to take into account of harmony between audio and image. In this paper, a design of overall system are mentioned ,and requirements and issues for image processing using machine learning, spatial audio processing process, harmonic mixing are discussed.
キーワード(和) サウンドスケープ / 機械学習 / 自動ミキシング / オブジェクト軌道推定 / 音と画像の調和
キーワード(英) Soundscape / Machine learning / Automatic mixing / Object's orbit estimation / Harmony between audio and image
資料番号 EA2020-66,SIP2020-97,SP2020-31
発行日 2021-02-24 (EA, SIP, SP)

研究会情報
研究会 EA / US / SP / SIP / IPSJ-SLP
開催期間 2021/3/3(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 音声,応用/電気音響,信号処理,超音波,一般
テーマ(英) Speech, Engineering/Electro Acoustics, Signal Processing, Ultrasonics, and Related Topics
委員長氏名(和) 古家 賢一(大分大) / 三浦 光(日大) / 河井 恒(NICT) / 林 和則(京大) / 北岡 教英(豊橋技科大)
委員長氏名(英) Kenichi Furuya(Oita Univ.) / Hikaru Miura(Nihon Univ.) / Hisashi Kawai(NICT) / Kazunori Hayashi(Kyoto Univ.) / 北岡 教英(豊橋技科大)
副委員長氏名(和) 梶川 嘉延(関西大) / 松井 健太郎(NHK) / 近藤 淳(静岡大) / 小池 義和(芝浦工大) / / 坂東 幸浩(NTT) / 田中 聡久(東京農工大)
副委員長氏名(英) Yoshinobu Kajikawa(Kansai Univ.) / Kentaro Matsui(NHK) / Jun Kondo(Shizuoka Univ.) / Yoshikazu Koike(Shibaura Inst. of Tech.) / / Yukihiro Bandou(NTT) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.)
幹事氏名(和) 小山 翔一(東大) / 加古 達也(NTT) / 小山 大介(同志社大) / 荒川 元孝(東北大) / 高道 慎之介(東大) / 小川 哲司(早大) / 小西 克巳(法政大) / 杉本 憲治郎(早大) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大) / 高道 慎之介(東大)
幹事氏名(英) Shoichi Koyama(Univ. of Tokyo) / Tatsuya Kako(NTT) / Daisuke Koyama(Doshisha Univ.) / Mototaka Arakawa(Tohoku Univ.) / Shinnosuke Takamichi(Univ. of Tokyo) / Tetsuji Ogawa(Waseda Univ.) / Katsumi Konishi(Hosei Univ.) / Kenjiro Sugimoto(Waseda Univ.) / 秋田 祐哉(京大) / 太刀岡 勇気(デンソーアイティーラボラトリ) / 高島 遼一(神戸大) / 高道 慎之介(東大)
幹事補佐氏名(和) 若林 佑幸(都立大) / 小松 達也(LINE) / 平田 慎之介(東工大) / 井島 勇祐(NTT) / 田中 雄一(東京農工大)
幹事補佐氏名(英) Yukou Wakabayashi(Tokyo Metropolitan Univ.) / Tatsuya Komatsu(LINE) / Shinnosuke Hirata(Tokyo Inst. of Tech.) / Yusuke Ijima(NTT) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.)

講演論文情報詳細
申込み研究会 Technical Committee on Engineering Acoustics / Technical Committee on Ultrasonics / Technical Committee on Speech / Technical Committee on Signal Processing / Special Interest Group on Spoken Language Processing
本文の言語 JPN
タイトル(和) [ポスター講演]画像内の物体検出に基づくサウンドスケープ自動生成システムの課題
サブタイトル(和)
タイトル(英) [Poster Presentation] Issues on automatic soundscape generation based on image object detection
サブタイトル(和)
キーワード(1)(和/英) サウンドスケープ / Soundscape
キーワード(2)(和/英) 機械学習 / Machine learning
キーワード(3)(和/英) 自動ミキシング / Automatic mixing
キーワード(4)(和/英) オブジェクト軌道推定 / Object's orbit estimation
キーワード(5)(和/英) 音と画像の調和 / Harmony between audio and image
第 1 著者 氏名(和/英) 苣木 禎史 / Yoshifumi Chisaki
第 1 著者 所属(和/英) 千葉工業大学(略称:千葉工大)
Chiba Institute of Technology(略称:CIT)
第 2 著者 氏名(和/英) 堀内 俊治 / Toshiharu Horiuchi
第 2 著者 所属(和/英) 株式会社KDDI総合研究所(略称:KDDI総合研究所)
KDDI Research, Inc.(略称:KDDI Research, Inc.)
発表年月日 2021-03-03
資料番号 EA2020-66,SIP2020-97,SP2020-31
巻番号(vol) vol.120
号番号(no) EA-397,SIP-398,SP-399
ページ範囲 pp.41-44(EA), pp.41-44(SIP), pp.41-44(SP),
ページ数 4
発行日 2021-02-24 (EA, SIP, SP)