講演名 | 2022-12-16 Data Pruningにおけるサンプリング戦略 東 遼太(和歌山大), 和田 俊和(和歌山大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | Data Pruningは学習後の精度を維持するように訓練サンプル全体から一部を選択する手法である.識別モデルの学習では識別境界に近いHard Example(HE)が重要だが,学習済みモデルの出力をもとにHEを選ぶと,サンプル数の減少に伴いランダムサンプリングよりも精度は劣化する.この現象はHEのみでは特徴空間を再現できないためであるが,他の選択基準でも同様かは不明である.様々な基準で選択した訓練サンプルを用いた実験の結果から,適切な選択基準はサンプル数によって異なるため,Data Pruningにおいては異なる選択基準を如何に組み合わせるかが課題であると言える. |
抄録(英) | Data Pruning is a method of selecting the training data out of an entire training dataset so as to keep the accuracy after training. In discriminative models, Hard Examples (HEs) that are close to the decision boundary is important for training. However, when HEs are selected based on pretrained model’s outputs, the accuracy gets worse than random sampling as the sample size decreases. This phenomenon is caused that feature space cannot be reconstructed only from HE, but it is unclear if the phenomenon occurs by other criteria. The experiments using selected datasets by different criteria showed that the appropriate criterion varies by sample size, and it is necessary to combine different criteria in Data Pruning. |
キーワード(和) | 深層学習 / 枝狩り / 画像分類 / 識別境界 / サンプリング戦略 |
キーワード(英) | Deep Learning / Pruning / Image Classification / Decision Boundary / Sampling Strategy |
資料番号 | PRMU2022-48 |
発行日 | 2022-12-08 (PRMU) |
研究会情報 | |
研究会 | PRMU |
---|---|
開催期間 | 2022/12/15(から2日開催) |
開催地(和) | 富山国際会議場 |
開催地(英) | Toyama International Conference Center |
テーマ(和) | 制御のためのCV |
テーマ(英) | |
委員長氏名(和) | 内田 誠一(九大) |
委員長氏名(英) | Seiichi Uchida(Kyushu Univ.) |
副委員長氏名(和) | 舩冨 卓哉(奈良先端大) / 安倍 満(デンソーアイティーラボラトリ) |
副委員長氏名(英) | Takuya Funatomi(NAIST) / Mitsuru Anpai(Denso IT Lab.) |
幹事氏名(和) | 山口 光太(サイバーエージェント) / 松井 勇佑(東大) |
幹事氏名(英) | Kouta Yamaguchi(CyberAgent) / Yusuke Matsui(Univ. of Tokyo) |
幹事補佐氏名(和) | 井上 中順(東工大) / 川西 康友(理研) |
幹事補佐氏名(英) | Nakamasa Inoue(Tokyo Inst. of Tech.) / Yasutomo Kawanishi(Riken) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Pattern Recognition and Media Understanding |
---|---|
本文の言語 | JPN |
タイトル(和) | Data Pruningにおけるサンプリング戦略 |
サブタイトル(和) | |
タイトル(英) | Sampling Strategy in Data Pruning |
サブタイトル(和) | |
キーワード(1)(和/英) | 深層学習 / Deep Learning |
キーワード(2)(和/英) | 枝狩り / Pruning |
キーワード(3)(和/英) | 画像分類 / Image Classification |
キーワード(4)(和/英) | 識別境界 / Decision Boundary |
キーワード(5)(和/英) | サンプリング戦略 / Sampling Strategy |
第 1 著者 氏名(和/英) | 東 遼太 / Ryota Higashi |
第 1 著者 所属(和/英) | 和歌山大学(略称:和歌山大) Wakayama University(略称:Wakayama Univ.) |
第 2 著者 氏名(和/英) | 和田 俊和 / Toshikazu Wada |
第 2 著者 所属(和/英) | 和歌山大学(略称:和歌山大) Wakayama University(略称:Wakayama Univ.) |
発表年月日 | 2022-12-16 |
資料番号 | PRMU2022-48 |
巻番号(vol) | vol.122 |
号番号(no) | PRMU-314 |
ページ範囲 | pp.85-90(PRMU), |
ページ数 | 6 |
発行日 | 2022-12-08 (PRMU) |