RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング

西村 良太; 檜垣 美帆; 北岡 教英

講演名	2018-06-29 RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング西村良太(徳島大), 檜垣美帆(徳島大), 北岡教英(徳島大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	本研究では，近年高い成果をあげ，急速に発展・活用されている機械学習アルゴリズムである深層学習（Deep Learning）を用いて，異なるメディア間での検索（クロスメディアマッピング）を行う手法を提案する．ネットワークには，再帰型ニューラルネットワーク（Recurrent Neural Network : RNN）を用いる．提案手法を用いることで，例えば音楽と歌詞との対応付けが可能となり，文書を用いて音楽を検索することが可能となる．本モデルを適用することで，人間同士の対話をモニタリングし，会話内容から適切なBGMを提供する楽曲提案システムなどを実現することができる．本稿では，提案モデルを構築し，評価実験を行い，クロスメディアマッピングが可能であることを確認した．
抄録(英)	In this research, we propose a method of searching between different media (cross media mapping) using deep learning (Machine learning algorithm which is developed and utilized rapidly in recent years). A recurrent neural network (RNN) is used for the network. By using the proposed method, music and lyrics can be correlated, and music can be searched using documents. By applying this model, it is possible to realize a music suggestion system that monitors human-to-human dialogue and provides appropriate BGM. In this paper, we constructed a proposal model, conducted an evaluation experiment, and confirmed the possibility of cross media mapping.
キーワード(和)	RNN / LSTM / クロスメディアマッピング / chromaベクトル / word2vec
キーワード(英)	RNN / LSTM / cross-media mapping / chroma vector / word2vec
資料番号	PRMU2018-32,SP2018-12
発行日	2018-06-21 (PRMU, SP)

研究会情報
研究会	PRMU / SP
開催期間	2018/6/28(から2日開催)
開催地（和）	信州大学
開催地（英）
テーマ（和）	マルチモーダル/クロスモーダルな認識、生成
テーマ（英）
委員長氏名（和）	佐藤真一(NII) / 山下洋一(立命館大)
委員長氏名（英）	Shinichi Sato(NII) / Yoichi Yamashita(Ritsumeikan Univ.)
副委員長氏名（和）	井尻善久(オムロン) / 玉木徹(広島大) / 李晃伸(名工大)
副委員長氏名（英）	Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Akinobu Ri(Nagoya Inst. of Tech.)
幹事氏名（和）	石井雅人(NEC) / 菅野裕介(阪大) / 南條浩輝(京大) / 坂野秀樹(名城大)
幹事氏名（英）	Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.)
幹事補佐氏名（和）	入江豪(NTT) / 牛久祥孝(東大) / 郡山知樹(東工大) / 小橋川哲(NTT)
幹事補佐氏名（英）	Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Speech
本文の言語	JPN
タイトル（和）	RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング
サブタイトル（和）
タイトル（英）	Mapping Acoustic Vector Sequence to Document Vector Based on RNN
サブタイトル（和）
キーワード(1)（和/英）	RNN / RNN
キーワード(2)（和/英）	LSTM / LSTM
キーワード(3)（和/英）	クロスメディアマッピング / cross-media mapping
キーワード(4)（和/英）	chromaベクトル / chroma vector
キーワード(5)（和/英）	word2vec / word2vec
第 1 著者氏名（和/英）	西村良太 / Ryota Nishimura
第 1 著者所属（和/英）	徳島大学(略称：徳島大) Tokushima University(略称：Tokushima Univ.)
第 2 著者氏名（和/英）	檜垣美帆 / Miho Higaki
第 2 著者所属（和/英）	徳島大学(略称：徳島大) Tokushima University(略称：Tokushima Univ.)
第 3 著者氏名（和/英）	北岡教英 / Norihide Kitaoka
第 3 著者所属（和/英）	徳島大学(略称：徳島大) Tokushima University(略称：Tokushima Univ.)
発表年月日	2018-06-29
資料番号	PRMU2018-32,SP2018-12
巻番号（vol）	vol.118
号番号（no）	PRMU-111,SP-112
ページ範囲	pp.59-64(PRMU), pp.59-64(SP),
ページ数	6
発行日	2018-06-21 (PRMU, SP)