講演名 2019-03-01
RGB-D SLAMの3次元情報を用いたデータ拡張
宮本 健(三菱電機), 塚原 整(三菱電機),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 深層学習を用いて物体を認識するモデルを作成するには,大量の正解付きデータが必要である.認識対象を任意に決める場合,対象ごとの大量の正解データ付与は現実的でないことから,少数の正解付きデータを拡張して大量のデータを生成する方法が発表されている.代表的な方法として,3次元シミュレータ上で認識対象のグラフィックスモデルを複数の視点や照明条件でレンダリングする方法と,2次元画像に対して平行移動や回転,拡縮などを加える方法の二つがある.様々な視点で撮影した自然画像から特定物体を認識するネットワークを作成するには,同様の自然画像とその正解が大量に必要であるが,これらデータ拡張方法ではそのようなデータは得られない. 少ない手間で,様々な視点で撮影した特定物体の自然画像とその正解を大量に得るため, 3次元情報を用いたデータ拡張を検討する.RGB-D SLAMで撮影して得る画像上で特定物体の範囲を指定すると,SLAMで求めた位置・姿勢と,距離を使って範囲に対応する3次元の位置を求める.他の画像に投影することで一回の指定で複数画像に映っている特定物体の範囲を指定する. 特定物体を上記の方法で切り出して作成した画像をFCN16sで学習した結果,2次元画像を用いたデータ拡張で作成した画像を学習したときと比べて,mIoUが向上した.
抄録(英) Large data preparation is inevitable for training a deep neural network. Preparing the large data with handcrafted label is not practical for recognizing an arbitrary object. Hence, various data augmentation methods have been published in the recent years. One of the representatives uses a computer graphics model. It can create images rendered from viewpoints under various light conditions. The second one augments images by translation, rotation or scaling. It is indispensable to train images taken from various viewpoints for recognizing an object on a natural image taken from an arbitrary viewpoint. However, the conventional data augmentations can’t create the images. We propose data augmentation based on 3D data taken through RGB-D SLAM. Our augmentation can create the images with low human cost. A user directs a recognition target area from an image obtained through RGB-D SLAM. The directed area is transformed to 3D positions using pose and depth. Additionally, the 3D positions are projected to all other images for obtaining corresponding directed areas. When training images obtained by the direction, the result shows that the mIoU is better than training images augmented by mix of translation, rotation and flipping.
キーワード(和) データ拡張 / Simultaneous Localization And Mapping / SLAM
キーワード(英) Data Augmentation / Simultaneous Localization And Mapping / SLAM
資料番号 PRMU2018-124,CNR2018-47
発行日 2019-02-21 (PRMU, CNR)

研究会情報
研究会 PRMU / CNR
開催期間 2019/2/28(から2日開催)
開催地(和) 徳島大学
開催地(英)
テーマ(和) ロホ?ティクスとそれを支えるヒ?シ?ョン技術
テーマ(英)
委員長氏名(和) 佐藤 真一(NII) / 小野 哲雄(北大)
委員長氏名(英) Shinichi Sato(NII) / Tetsuo Ono(Hokkaido Univ.)
副委員長氏名(和) 井尻 善久(オムロン) / 玉木 徹(広島大) / 神原 誠之(奈良先端大) / 高汐 一紀(慶大)
副委員長氏名(英) Yoshihisa Ijiri(Omron) / Toru Tamaki(Hiroshima Univ.) / Masayuki Kanbara(NAIST) / Kazunori Takashio(Keio Univ.)
幹事氏名(和) 石井 雅人(NEC) / 菅野 裕介(阪大) / 坂本 大介(北大) / 吉岡 康介(パナソニック)
幹事氏名(英) Masato Ishii(NEC) / Yusuke Sugano(Osaka Univ.) / Daisuke Sakamoto(Hokkaido Univ.) / Kosuke Yoshioka(Panasonic)
幹事補佐氏名(和) 入江 豪(NTT) / 牛久 祥孝(東大) / 水戸 和(セコム) / 小林 優佳(東芝) / 石原 達也(NTT)
幹事補佐氏名(英) Go Irie(NTT) / Yoshitaka Ushiku(Univ. of Tokyo) / Wataru Mito(SECOM) / Yuka Kobayashi(Toshiba) / Tatsuya Ishihara(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding / Technical Committee on Cloud Network Robotics
本文の言語 JPN
タイトル(和) RGB-D SLAMの3次元情報を用いたデータ拡張
サブタイトル(和)
タイトル(英) Data Augmentation based on RGB-D SLAM 3D Data
サブタイトル(和)
キーワード(1)(和/英) データ拡張 / Data Augmentation
キーワード(2)(和/英) Simultaneous Localization And Mapping / Simultaneous Localization And Mapping
キーワード(3)(和/英) SLAM / SLAM
第 1 著者 氏名(和/英) 宮本 健 / Ken Miyamoto
第 1 著者 所属(和/英) 三菱電機株式会社(略称:三菱電機)
Mitsubishi Electric Corporation(略称:MELCO)
第 2 著者 氏名(和/英) 塚原 整 / Osamu Tsukahara
第 2 著者 所属(和/英) 三菱電機株式会社(略称:三菱電機)
Mitsubishi Electric Corporation(略称:MELCO)
発表年月日 2019-03-01
資料番号 PRMU2018-124,CNR2018-47
巻番号(vol) vol.118
号番号(no) PRMU-459,CNR-460
ページ範囲 pp.53-57(PRMU), pp.53-57(CNR),
ページ数 5
発行日 2019-02-21 (PRMU, CNR)