講演名 | 2018-06-29 RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング 西村 良太(徳島大), 檜垣 美帆(徳島大), 北岡 教英(徳島大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本研究では,近年高い成果をあげ,急速に発展・活用されている機械学習アルゴリズムである深層学習(Deep Learning)を用いて,異なるメディア間での検索(クロスメディアマッピング)を行う手法を提案する.ネットワークには,再帰型ニューラルネットワーク(Recurrent Neural Network : RNN)を用いる.提案手法を用いることで,例えば音楽と歌詞との対応付けが可能となり,文書を用いて音楽を検索することが可能となる.本モデルを適用することで,人間同士の対話をモニタリングし,会話内容から適切なBGMを提供する楽曲提案システムなどを実現することができる.本稿では,提案モデルを構築し,評価実験を行い,クロスメディアマッピングが可能であることを確認した. |
抄録(英) | In this research, we propose a method of searching between different media (cross media mapping) using deep learning (Machine learning algorithm which is developed and utilized rapidly in recent years). A recurrent neural network (RNN) is used for the network. By using the proposed method, music and lyrics can be correlated, and music can be searched using documents. By applying this model, it is possible to realize a music suggestion system that monitors human-to-human dialogue and provides appropriate BGM. In this paper, we constructed a proposal model, conducted an evaluation experiment, and confirmed the possibility of cross media mapping. |
キーワード(和) | RNN / LSTM / クロスメディアマッピング / chromaベクトル / word2vec |
キーワード(英) | RNN / LSTM / cross-media mapping / chroma vector / word2vec |
資料番号 | PRMU2018-32,SP2018-12 |
発行日 | 2018-06-21 (PRMU, SP) |
研究会情報 | |
研究会 | PRMU / SP |
---|---|
開催期間 | 2018/6/28(から2日開催) |
開催地(和) | 信州大学 |
開催地(英) | |
テーマ(和) | マルチモーダル/クロスモーダルな認識、生成 |
テーマ(英) | |
委員長氏名(和) | 佐藤 真一(NII) / 山下 洋一(立命館大) |
委員長氏名(英) | Shinichi Sato(NII) / Yoichi Yamashita(Ritsumeikan Univ.) |
副委員長氏名(和) | 井尻 善久(オムロン) / 玉木 徹(広島大) / 李 晃伸(名工大) |
副委員長氏名(英) | Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Akinobu Ri(Nagoya Inst. of Tech.) |
幹事氏名(和) | 石井 雅人(NEC) / 菅野 裕介(阪大) / 南條 浩輝(京大) / 坂野 秀樹(名城大) |
幹事氏名(英) | Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Hiroaki Nanjo(Kyoto Univ.) / Hideki Banno(Meijo Univ.) |
幹事補佐氏名(和) | 入江 豪(NTT) / 牛久 祥孝(東大) / 郡山 知樹(東工大) / 小橋川 哲(NTT) |
幹事補佐氏名(英) | Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Tomoki Koriyama(Tokyo Inst. of Tech.) / Satoshi Kobashikawa(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Speech |
---|---|
本文の言語 | JPN |
タイトル(和) | RNNに基づく音響ベクトル時系列の文書ベクトルへのマッピング |
サブタイトル(和) | |
タイトル(英) | Mapping Acoustic Vector Sequence to Document Vector Based on RNN |
サブタイトル(和) | |
キーワード(1)(和/英) | RNN / RNN |
キーワード(2)(和/英) | LSTM / LSTM |
キーワード(3)(和/英) | クロスメディアマッピング / cross-media mapping |
キーワード(4)(和/英) | chromaベクトル / chroma vector |
キーワード(5)(和/英) | word2vec / word2vec |
第 1 著者 氏名(和/英) | 西村 良太 / Ryota Nishimura |
第 1 著者 所属(和/英) | 徳島大学(略称:徳島大) Tokushima University(略称:Tokushima Univ.) |
第 2 著者 氏名(和/英) | 檜垣 美帆 / Miho Higaki |
第 2 著者 所属(和/英) | 徳島大学(略称:徳島大) Tokushima University(略称:Tokushima Univ.) |
第 3 著者 氏名(和/英) | 北岡 教英 / Norihide Kitaoka |
第 3 著者 所属(和/英) | 徳島大学(略称:徳島大) Tokushima University(略称:Tokushima Univ.) |
発表年月日 | 2018-06-29 |
資料番号 | PRMU2018-32,SP2018-12 |
巻番号(vol) | vol.118 |
号番号(no) | PRMU-111,SP-112 |
ページ範囲 | pp.59-64(PRMU), pp.59-64(SP), |
ページ数 | 6 |
発行日 | 2018-06-21 (PRMU, SP) |