講演名 2017-03-21
信号データに対するデータ拡張について
江口 脩(福岡大), 田中 勝(福岡大), 藤木 淳(福岡大), 栗田 多喜夫(広島大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 機械学習において,限られたデータを用いて効率よく学習することはビッグデータの時代となった現在においても重要である.画像識別の場合は,元のサンプルに基づき平行移動や鏡面反転,色付けなどのデータ拡張を行いバリエーションを増やしてデータ数を増やす.本研究では,楽器音データに対するデータ拡張を行う.具体的には,楽器音を再生時間と標本周波数でグラフ化した画像に変換し,その画像に色付けを行うことにより,データ拡張を行う.色付けにより,単純に本来の信号データよりも3chに拡張された分だけ多くの情報を得ることができる.そして,この拡張されたデータを入力データとして深層学習のツールであるChainerで実装されたGoogLeNetを用いて学習を行う.このシステムで,フルート,オーボエ,ファゴットの3種類の楽器で作成した楽器音から演奏楽器を認識する学習を行うことにより,信号処理に対しても画像識別と同様なデータ拡張が可能であることを確認した.
抄録(英) Efficient learning using limited data in machine learning is also important now even in the era of big data. In the case of image identification, data expansion such as parallel movement, specular inversion, coloring or the like is performed based on the original sample to increase variations and increase the number of data. In this research, we extend data to musical instrument sound data. Specifically, the instrument sound is converted into an image graphically represented by the reproduction time and the sample frequency, and the data is expanded by coloring the image. By coloring, it is possible to obtain as much information as simply being expanded to 3 ch than the original signal data. Then, learning is performed using GoogLeNet implemented by Chainer which is a deep learning tool using this extended data as input data. With this system, learning to recognize a musical instrument from instrumental sounds created with three kinds of instruments such as flute, oboe and fagott, it is possible to expand data similar to image identification even for signal processing confirmed.
キーワード(和) 楽器音 / 和音 / 信号処理 / 画像識別 / Chainer / データ拡張
キーワード(英) instrument sound / musical chord / signal processing / image recognition / chainer / ata extension
資料番号 BioX2016-73,PRMU2016-236
発行日 2017-03-13 (BioX, PRMU)

研究会情報
研究会 PRMU / BioX
開催期間 2017/3/20(から2日開催)
開催地(和) 名城大
開催地(英)
テーマ(和) 安心安全と社会
テーマ(英)
委員長氏名(和) 前田 英作(NTT) / 西垣 正勝(静岡大)
委員長氏名(英) Eisaku Maeda(NTT) / Masakatsu Nishigaki(Shizuoka Univ.)
副委員長氏名(和) 内田 誠一(九大) / 藤吉 弘亘(中部大) / 大塚 玲(産総研) / 高野 博史(富山県立大)
副委員長氏名(英) Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / Akira Otsuka(AIST) / Hiroshi Takano(Toyama Pref. Univ.)
幹事氏名(和) 近藤 一晃(京大) / 木村 昭悟(NTT) / 今岡 仁(NEC) / 大木 哲史(産総研)
幹事氏名(英) Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / Hitoshi Imaoka(NEC) / Tetsushi Ohki(AIST)
幹事補佐氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 市野 将嗣(電通大) / 高田 直幸(セコム) / 青木 隆浩(富士通研)
幹事補佐氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Masatsugu Ichino(Univ. of Electro-Comm.) / Naoyuki Takada(Secom) / Takahiro Aoki(Fujitsu Labs.)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Biometrics
本文の言語 JPN
タイトル(和) 信号データに対するデータ拡張について
サブタイトル(和)
タイトル(英) On Data Extension For Signal Data
サブタイトル(和)
キーワード(1)(和/英) 楽器音 / instrument sound
キーワード(2)(和/英) 和音 / musical chord
キーワード(3)(和/英) 信号処理 / signal processing
キーワード(4)(和/英) 画像識別 / image recognition
キーワード(5)(和/英) Chainer / chainer
キーワード(6)(和/英) データ拡張 / ata extension
第 1 著者 氏名(和/英) 江口 脩 / Shu Eguchi
第 1 著者 所属(和/英) 福岡大学(略称:福岡大)
Fukuoka University(略称:Fukuoka Univ.)
第 2 著者 氏名(和/英) 田中 勝 / Masaru Tanaka
第 2 著者 所属(和/英) 福岡大学(略称:福岡大)
Fukuoka University(略称:Fukuoka Univ.)
第 3 著者 氏名(和/英) 藤木 淳 / Jun Fujiki
第 3 著者 所属(和/英) 福岡大学(略称:福岡大)
Fukuoka University(略称:Fukuoka Univ.)
第 4 著者 氏名(和/英) 栗田 多喜夫 / Takio Kurita
第 4 著者 所属(和/英) 広島大学(略称:広島大)
Hiroshima University(略称:Hiroshima Univ.)
発表年月日 2017-03-21
資料番号 BioX2016-73,PRMU2016-236
巻番号(vol) vol.116
号番号(no) BioX-527,PRMU-528
ページ範囲 pp.237-242(BioX), pp.237-242(PRMU),
ページ数 6
発行日 2017-03-13 (BioX, PRMU)