講演名 2018-03-18
空間周波数と色に基づく損失関数を用いた畳み込みオートエンコーダの学習
市村 直幸(産総研),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,画像からの特徴抽出を目的とした畳み込みオートエンコーダ(Convolutional Autoencoders:CAEs) の学習方法を示す.CAEs は,convolutional neural networks により恒等写像を近似する教師なし学習を通じ得られる.その学習には,入力である原画像と出力である再構成画像,この2 つの画像の画素値の平均2 乗誤差(Pixel Loss:PL) に基づく損失関数が用いられる.しかし,その損失関数を用いた学習には,再構成画像にボケが生じる,および,色の再現に多くのエポック数を必要とするという問題がある.これらの問題を解決するため,空間周波数と色に基づく損失関数を用いた学習方法を提案する.再構成画像におけるボケの発生は,高い空間周波数成分が欠落することを意味する.この欠落を評価するために,Laplacian フィルタバンクを重みとする畳み込み層をCAEs に付加し,各Laplacian フィルタの出力から部分帯域の平均2 乗誤差(Spatial Frequency Loss:SFL) を求める.また,色の再現を評価するためには,色成分と輝度成分を分離する畳み込み層を付加し,色成分の平均2 乗誤差(Chromatic Loss:CL) を求める.そして,SFL およびCL に基づく損失関数を用い学習を行う.実験を通じ,SFLの導入により再構成画像のボケが軽減され,また,CL の導入により色の再現が促進されることを明らかにした.
抄録(英) This paper presents a learning method for convolutional autoencoders (CAEs) for extracting features from images. CAEs can be obtained by utilizing convolutional neural networks to learn an approximation to the identity function in an unsupervised manner. The loss function based on the pixel loss (PL) that is computed from the mean squared errors between the pixel values of original images and reconstructed images is the common choice for learning. However, using the loss function leads to blurred reconstructed images and requires a large number of epochs to reproduce colors. A method for learning CAEs using a loss function based on spatial frequencies and colors is proposed to mitigate the problems. The blurs in reconstructed images show lack of high spatial frequency components. In order to evaluate the lack of components, a convolutional layer with a Laplacian filter bank as weights is added to CAEs and the mean squared error of a subband (Spatial Frequency Loss:SFL) is obtained from the output of each filter. The mean squared error of a chromatic component (Chromatic Loss:CL) is introduced as well to evaluate color reproduction by addition a convolutional layer by which chromatic components are separated from a luminance component. The learning is performed using a loss function based on the SFL and CL. Empirical evaluation demonstrates that using the SFL reduces the blurs and using the CL facilitates the reproduction of colors.
キーワード(和) 畳み込みオートエンコーダ / 教師なし学習 / 損失関数 / 空間周波数 / 色
キーワード(英) Convolutional autoencoders / Unsupervised learning / Loss function / Spatial frequency / Color
資料番号 BioX2017-36,PRMU2017-172
発行日 2018-03-11 (BioX, PRMU)

研究会情報
研究会 PRMU / BioX
開催期間 2018/3/18(から2日開催)
開催地(和) 青山学院大学 青山キャンパス
開催地(英)
テーマ(和) オープンイノベーション
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 鷲見 和彦(青学大)
委員長氏名(英) Shinichi Sato(NII) / Kazuhiko Sumi(AGU)
副委員長氏名(和) 藤吉 弘亘(中部大) / 井尻 善久(オムロン) / 高野 博史(富山県立大) / 今岡 仁(NEC)
副委員長氏名(英) Hironobu Fujiyoshi(Chubu Univ.) / Yoshihisa Ijiri(Omron) / Hiroshi Takano(Toyama Pref. Univ.) / Hitoshi Imaoka(NEC)
幹事氏名(和) 大西 正輝(産総研) / 舩冨 卓哉(奈良先端大) / 大木 哲史(静岡大) / 青木 隆浩(富士通研)
幹事氏名(英) Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Tetsushi Ohki(Shizuoka Univ.) / Takahiro Aoki(Fujitsu Labs.)
幹事補佐氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 市野 将嗣(電通大) / 高田 直幸(セコム) / 奥井 宣広(KDDI総合研究所)
幹事補佐氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Masatsugu Ichino(Univ. of Electro-Comm.) / Naoyuki Takada(Secom) / Norihiro Okui(KDDI Research)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Biometrics
本文の言語 JPN
タイトル(和) 空間周波数と色に基づく損失関数を用いた畳み込みオートエンコーダの学習
サブタイトル(和)
タイトル(英) Learning Convolutional Autoencoders Using a Loss Function Based on Spatial Frequencies and Colors
サブタイトル(和)
キーワード(1)(和/英) 畳み込みオートエンコーダ / Convolutional autoencoders
キーワード(2)(和/英) 教師なし学習 / Unsupervised learning
キーワード(3)(和/英) 損失関数 / Loss function
キーワード(4)(和/英) 空間周波数 / Spatial frequency
キーワード(5)(和/英) 色 / Color
第 1 著者 氏名(和/英) 市村 直幸 / Naoyuki Ichimura
第 1 著者 所属(和/英) 産業技術総合研究所(略称:産総研)
National Institute of Advanced Industrial Science and Technology(略称:AIST)
発表年月日 2018-03-18
資料番号 BioX2017-36,PRMU2017-172
巻番号(vol) vol.117
号番号(no) BioX-513,PRMU-514
ページ範囲 pp.1-6(BioX), pp.1-6(PRMU),
ページ数 6
発行日 2018-03-11 (BioX, PRMU)