部分と全体に着目したCNNの融合による歩行者の属性の詳細認識

小久保 嘉人; ワン ユ; 加藤 ジェーン; 間瀬 健二

講演名	2017-02-18 部分と全体に着目したCNNの融合による歩行者の属性の詳細認識小久保嘉人(名大), ワンユ(名大), 加藤ジェーン(名大), 間瀬健二(名大),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	歩行者の詳細な属性情報は，歩行者のより高次な振る舞いの理解に役立ち，次世代の乗り物や監視システムなどで活用される重大な要素となる．本論文では，近年様々な分野で飛躍的な成果を挙げている畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)を利用し，部分画像と全体画像，それぞれから得られる特徴の統合による，歩行者の詳細認識手法を提案する．一般に，認識対象の部分画像をネットワークの入力とした場合，該当部分に対しては詳細な特徴が表現できるが，画像全体の情報が欠落する．一方，認識対象の全体画像を入力とした場合は，画像全体のアピアランスを考慮することができるが，各部分に対しては，部分画像を用いて学習した場合と比較して詳細な特徴が表現できない．提案手法では，複数の部分画像と全体画像，それぞれのパッチ別にCNNモデルを学習する．そして，各CNNモデルを統合したネットワークに対して再学習をすることで，相互の欠点を排し，より高精度な認識を実現する．評価実験では，提案手法は全体画像単独から学習するネットワークの精度を上回ることが確認された．
抄録(英)	Fine-grained categories of pedestrians lead to higher level understanding on pedestrians as well as their activities, therefore is a perspective key component in the next generation smart vehicle and surveillance systems. In this study, we propose fine-grained pedestrian classification method by integrating features obtained from partial image and whole image using Convolutional Neural Network (CNN), which has dramatically improved results in various fields in recent years. Generally, when the partial image is given as an input to the network, detailed features can be expressed for the local portion, but the entire information is missing. On the other hand, when the entire image is given as an input to the network, it is possible to consider the appearance of the entire image, but detailed features can not be acquired compared with learning using a partial image. In the proposed method, a CNN model is learned for each patch of partial images and an entire image. Next, by re-training the fusion network in which all CNN models are integrated, the proposed method can eliminate mutual disadvantages and implement more accurate classification. In the experiment, we confirmed that the proposed method exceeds the baseline accuracy.
キーワード(和)	画像分類 / ディープ・ラーニング
キーワード(英)	image classification / deep learning
資料番号	PRMU2016-166,CNR2016-33
発行日	2017-02-11 (PRMU, CNR)

研究会情報
研究会	PRMU / CNR
開催期間	2017/2/18(から2日開催)
開催地（和）	北海道大学
開催地（英）
テーマ（和）	実世界センシングと応用
テーマ（英）
委員長氏名（和）	前田英作(NTT) / 今井倫太(慶大)
委員長氏名（英）	Eisaku Maeda(NTT) / Michita Imai(Keio Univ.)
副委員長氏名（和）	内田誠一(九大) / 藤吉弘亘(中部大) / 小野哲雄(北大) / 神原誠之(奈良先端大)
副委員長氏名（英）	Seiichi Uchida(Kyushu Univ.) / Hironobu Fujiyoshi(Chubu Univ.) / Tetsuo Ono(Hokkaido Univ.) / Masayuki Kanbara(NAIST)
幹事氏名（和）	近藤一晃(京大) / 木村昭悟(NTT) / 坂本大介(東大) / 大澤博隆(筑波大)
幹事氏名（英）	Kazuaki Kondo(Kyoto Univ.) / Akisato Kimura(NTT) / Daisuke Sakamoto(Univ. of Tokyo) / Hirotaka Osawa(Univ. of Tsukuba)
幹事補佐氏名（和）	大西正輝(産総研) / 舩冨卓哉(奈良先端大) / 吉岡康介(パナソニック) / 山本大介(東芝) / 松元崇裕(NTT)
幹事補佐氏名（英）	Masaki Oonishi(AIST) / Takuya Funatomi(NAIST) / Kosuke Yoshioka(Panasonic) / Daisuke Yamamoto(Toshiba) / Takahiro Matsumoto(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Cloud Network Robotics
本文の言語	JPN
タイトル（和）	部分と全体に着目したCNNの融合による歩行者の属性の詳細認識
サブタイトル（和）
タイトル（英）	Fine-grained Pedestrian Classification by Fusing Multiple CNN Models
サブタイトル（和）
キーワード(1)（和/英）	画像分類 / image classification
キーワード(2)（和/英）	ディープ・ラーニング / deep learning
第 1 著者氏名（和/英）	小久保嘉人 / Yoshihito Kokubo
第 1 著者所属（和/英）	名古屋大学(略称：名大) Nagoya University(略称：Nagoya Univ.)
第 2 著者氏名（和/英）	ワンユ / Yu Wang
第 2 著者所属（和/英）	名古屋大学(略称：名大) Nagoya University(略称：Nagoya Univ.)
第 3 著者氏名（和/英）	加藤ジェーン / Jien Kato
第 3 著者所属（和/英）	名古屋大学(略称：名大) Nagoya University(略称：Nagoya Univ.)
第 4 著者氏名（和/英）	間瀬健二 / Kenji Mase
第 4 著者所属（和/英）	名古屋大学(略称：名大) Nagoya University(略称：Nagoya Univ.)
発表年月日	2017-02-18
資料番号	PRMU2016-166,CNR2016-33
巻番号（vol）	vol.116
号番号（no）	PRMU-461,CNR-462
ページ範囲	pp.81-85(PRMU), pp.81-85(CNR),
ページ数	5
発行日	2017-02-11 (PRMU, CNR)