講演名 2018-06-29
RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング
西村 良太(徳島大), 檜垣 美帆(徳島大), 北岡 教英(徳島大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,近年高い成果をあげ,急速に発展・活用されている機械学習アルゴリズムである深層学習(Deep Learning)を用いて,異なるメディア間での検索(クロスメディアマッピング)を行う手法を提案する.ネットワークには,再帰型ニューラルネットワーク(Recurrent Neural Network : RNN)を用いる.提案手法を用いることで,例えば音楽と歌詞との対応付けが可能となり,文書を用いて音楽を検索することが可能となる.本モデルを適用することで,人間同士の対話をモニタリングし,会話内容から適切なBGMを提供する楽曲提案システムなどを実現することができる.本稿では,提案モデルを構築し,評価実験を行い,クロスメディアマッピングが可能であることを確認した.
抄録(英) In this research, we propose a method of searching between different media (cross media mapping) using deep learning (Machine learning algorithm which is developed and utilized rapidly in recent years). A recurrent neural network (RNN) is used for the network. By using the proposed method, music and lyrics can be correlated, and music can be searched using documents. By applying this model, it is possible to realize a music suggestion system that monitors human-to-human dialogue and provides appropriate BGM. In this paper, we constructed a proposal model, conducted an evaluation experiment, and confirmed the possibility of cross media mapping.
キーワード(和) RNN / LSTM / クロスメディアマッピング / chromaベクトル / word2vec
キーワード(英) RNN / LSTM / cross-media mapping / chroma vector / word2vec
資料番号 PRMU2018-32,SP2018-12
発行日 2018-06-21 (PRMU, SP)

研究会情報
研究会 PRMU / SP
開催期間 2018/6/28(から2日開催)
開催地(和) 信州大学
開催地(英)
テーマ(和) マルチモーダル/クロスモーダルな認識、生成
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 山下 洋一(立命館大)
委員長氏名(英) Shinichi Sato(NII) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大) / 李 晃伸(名工大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 南條 浩輝(京大) / 坂野 秀樹(名城大)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(東大) / 郡山 知樹(東工大) / 小橋川 哲(NTT)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Speech
本文の言語 JPN
タイトル(和) RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング
サブタイトル(和)
タイトル(英) Mapping Acoustic Vector Sequence to Document Vector Based on RNN
サブタイトル(和)
キーワード(1)(和/英) RNN / RNN
キーワード(2)(和/英) LSTM / LSTM
キーワード(3)(和/英) クロスメディアマッピング / cross-media mapping
キーワード(4)(和/英) chromaベクトル / chroma vector
キーワード(5)(和/英) word2vec / word2vec
第 1 著者 氏名(和/英) 西村 良太 / Ryota Nishimura
第 1 著者 所属(和/英) 徳島大学(略称:徳島大)
Tokushima University(略称:Tokushima Univ.)
第 2 著者 氏名(和/英) 檜垣 美帆 / Miho Higaki
第 2 著者 所属(和/英) 徳島大学(略称:徳島大)
Tokushima University(略称:Tokushima Univ.)
第 3 著者 氏名(和/英) 北岡 教英 / Norihide Kitaoka
第 3 著者 所属(和/英) 徳島大学(略称:徳島大)
Tokushima University(略称:Tokushima Univ.)
発表年月日 2018-06-29
資料番号 PRMU2018-32,SP2018-12
巻番号(vol) vol.118
号番号(no) PRMU-111,SP-112
ページ範囲 pp.59-64(PRMU), pp.59-64(SP),
ページ数 6
発行日 2018-06-21 (PRMU, SP)