講演抄録/キーワード |
講演名 |
2017-03-21 16:50
信号データに対するデータ拡張について ○江口 脩・田中 勝・藤木 淳(福岡大)・栗田多喜夫(広島大) BioX2016-73 PRMU2016-236 |
抄録 |
(和) |
機械学習において,限られたデータを用いて効率よく学習することはビッグデータの時代となった現在においても重要である.画像識別の場合は,元のサンプルに基づき平行移動や鏡面反転,色付けなどのデータ拡張を行いバリエーションを増やしてデータ数を増やす.本研究では,楽器音データに対するデータ拡張を行う.具体的には,楽器音を再生時間と標本周波数でグラフ化した画像に変換し,その画像に色付けを行うことにより,データ拡張を行う.色付けにより,単純に本来の信号データよりも3chに拡張された分だけ多くの情報を得ることができる.そして,この拡張されたデータを入力データとして深層学習のツールであるChainerで実装されたGoogLeNetを用いて学習を行う.このシステムで,フルート,オーボエ,ファゴットの3種類の楽器で作成した楽器音から演奏楽器を認識する学習を行うことにより,信号処理に対しても画像識別と同様なデータ拡張が可能であることを確認した. |
(英) |
Efficient learning using limited data in machine learning is also important now even in the era of big data. In the case of image identification, data expansion such as parallel movement, specular inversion, coloring or the like is performed based on the original sample to increase variations and increase the number of data. In this research, we extend data to musical instrument sound data. Specifically, the instrument sound is converted into an image graphically represented by the reproduction time and the sample frequency, and the data is expanded by coloring the image. By coloring, it is possible to obtain as much information as simply being expanded to 3 ch than the original signal data. Then, learning is performed using GoogLeNet implemented by Chainer which is a deep learning tool using this extended data as input data. With this system, learning to recognize a musical instrument from instrumental sounds created with three kinds of instruments such as flute, oboe and fagott, it is possible to expand data similar to image identification even for signal processing confirmed. |
キーワード |
(和) |
楽器音 / 和音 / 信号処理 / 画像識別 / Chainer / データ拡張 / / |
(英) |
instrument sound / musical chord / signal processing / image recognition / chainer / ata extension / / |
文献情報 |
信学技報, vol. 116, no. 528, PRMU2016-236, pp. 237-242, 2017年3月. |
資料番号 |
PRMU2016-236 |
発行日 |
2017-03-13 (BioX, PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
BioX2016-73 PRMU2016-236 |
|