講演抄録/キーワード |
講演名 |
2021-12-17 14:45
データの選択による効率的なDNNの学習 ○東 遼太・和田俊和(和歌山大) PRMU2021-51 |
抄録 |
(和) |
我々は,学習データ全体から一部を選ぶ「データ選択」により,効率的なDNNの学習を実現することを目指しており,本報告では,画像分類問題において,識別境界付近の点を選ぶ場合と,空間的に均一な点集合を選ぶ場合,およびランダム選択の場合,のそれぞれについて精度を比較した.その結果,選択するデータ数やデータセットに応じて最適な手法が異なることが判明し,データ選択の基準を適応的に変える必要性が示唆された.そして,データ選択による精度低下を回復する手段の一つとして蒸留(distillation)を適用し,その効果を検証した.データ選択はプロトタイピングや能動学習,重み付き学習などに応用可能であり,本報告で示された知見はその改善につながるものである. |
(英) |
We are investigating the method to sample the important data from the whole dataset for efficient training of Deep Neural Networks. In this report, we compare the accuracy of image classifiers trained from reduced datasets: sampled near the decision boundaries, sampled uniformly over the latent space, and sampled randomly. Experimental results imply that the optimal sampling varies depending on the number of samples, and the data selection criteria should be changed accordingly. Also, we introduce distillation to recover the accuracy degradation by the data reduction and evaluate its effect. Data selection can be applied to many problems: prototyping, active learning, and weighted learning. Findings in this report can be utilized to produce better solution of them. |
キーワード |
(和) |
深層学習 / データ選択 / 画像分類 / 蒸留 / 能動学習 / / / |
(英) |
Deep Learning / Data Selection / Image Classification / Distillation / Active Learning / / / |
文献情報 |
信学技報, vol. 121, no. 304, PRMU2021-51, pp. 148-153, 2021年12月. |
資料番号 |
PRMU2021-51 |
発行日 |
2021-12-09 (PRMU) |
ISSN |
Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2021-51 |