講演名 2020-10-09
Style Adapted DataBase: セマンティクスを考慮したスタイライゼーションによる手セグメンテーションの汎化
大川 武彦(東大), 八木 拓真(東大), 佐藤 洋一(東大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ウェアラブルカメラから得られる一人称視点映像におけるドメインシフトは,照明条件や背景のアピアランスの変化によって生じ,手セグメンテーションの精度を低下させる.本論文では,このようなドメインシフトの問題に対応するために,少数のターゲットラベルを用い,セマンティクスを考慮したスタイル変換によるドメイン適応手法を提案する.具体的には,ソース画像とターゲット画像をそれぞれコンテンツとスタイルとしてスタイル変換ネットワークに与え,これらのラベルによって前景と背景を分離した後,ネットワークは各領域ごとにソースデータにターゲットのスタイルを転移する.提案手法は,スタイル変換を施したソースデータセットに複数のスタイルを導入できることから,このデータセットで学習したモデルは複数のターゲットドメインに一度で同時に汎化する.提案手法は,最新の手セグメンテーションのためのドメイン適応手法と同等かそれ以上のクロスデータセット汎化性能を達成した.
抄録(英) Domain shift in first-person vision degrades the performance of hand segmentation, which is caused by changes in lighting conditions and background appearances. In this paper, we propose a semantics-aware stylization approach for domain adaptation using an image style transfer with only a few target labels. Specifically, given a source image as content and a target image as style, foreground and background are separated by their labels, and the network transfers the styles of the target image to the source image separately for the foreground and background. Multiple styles can be fed into a stylized source dataset, thus the model trained on the dataset simultaneously generalizes to multiple target domains at once. Our method achieves the best cross-dataset generalization against the state-of-the-art domain adaptation methods for hand segmentation.
キーワード(和) ドメイン適応 / スタイル変換 / 手セグメンテーション / 一人称ビジョン
キーワード(英) Domain Adaptation / Style Transfer / Hand Segmentation / First Person Vision
資料番号 PRMU2020-23
発行日 2020-10-02 (PRMU)

研究会情報
研究会 PRMU
開催期間 2020/10/9(から2日開催)
開催地(和) オンライン開催
開催地(英) Virtual
テーマ(和) 人に関わる認識・理解
テーマ(英) Recognition and understating of human
委員長氏名(和) 佐藤 洋一(東大)
委員長氏名(英) Yoichi Sato(Univ. of Tokyo)
副委員長氏名(和) 木村 昭悟(NTT) / 岩村 雅一(阪府大)
副委員長氏名(英) Akisato Kimura(NTT) / Masakazu Iwamura(Osaka Pref. Univ.)
幹事氏名(和) 内田 祐介(Mobility Technologies) / 山下 隆義(中部大)
幹事氏名(英) Yusuke Uchida(Mobility Technologies) / Takayoshi Yamashita(Chubu Univ.)
幹事補佐氏名(和) 柴田 剛志(NTT) / 西山 正志(鳥取大)
幹事補佐氏名(英) Takashi Shibata(NTT) / Masashi Nishiyama(Tottori Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Pattern Recognition and Media Understanding
本文の言語 ENG-JTITLE
タイトル(和) Style Adapted DataBase: セマンティクスを考慮したスタイライゼーションによる手セグメンテーションの汎化
サブタイトル(和)
タイトル(英) Style Adapted DataBase: Generalizing Hand Segmentation via Semantics-aware Stylization
サブタイトル(和)
キーワード(1)(和/英) ドメイン適応 / Domain Adaptation
キーワード(2)(和/英) スタイル変換 / Style Transfer
キーワード(3)(和/英) 手セグメンテーション / Hand Segmentation
キーワード(4)(和/英) 一人称ビジョン / First Person Vision
第 1 著者 氏名(和/英) 大川 武彦 / Takehiko Ohkawa
第 1 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 2 著者 氏名(和/英) 八木 拓真 / Takuma Yagi
第 2 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
第 3 著者 氏名(和/英) 佐藤 洋一 / Yoichi Sato
第 3 著者 所属(和/英) 東京大学(略称:東大)
The University of Tokyo(略称:UTokyo)
発表年月日 2020-10-09
資料番号 PRMU2020-23
巻番号(vol) vol.120
号番号(no) PRMU-187
ページ範囲 pp.26-31(PRMU),
ページ数 6
発行日 2020-10-02 (PRMU)