講演名 | 2022-03-11 クエリベースのアンカーを用いた人間と物体のインタラクション検出 陳 俊文(電通大), 柳井 啓司(電通大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 人間と物体のインタラクション(HOI)検出では,人間と物体のペアをローカライズし,画像から人間と物体間の意味的関係を抽出する必要がある.既存のone-stageの手法は,可能なインタラクションポイントの検出や人間と物体のペアのフィルタリングに注目している.空間スケールにおける異なる物体の位置やサイズの違いを考慮していない.本研究では,Transformerを用いたマルチスケールアーキテクチャを採用し,クエリに基づくアンカーを用いてHOIインスタンスの全ての要素を予測するone-stageの手法を提案する.また,Transformerベースのバックボーンを用いて,HICO-DETベンチマークで提案手法が最高精度を達成したことを示した. |
抄録(英) | no English abstract |
キーワード(和) | HOI検出 |
キーワード(英) | Transformer |
資料番号 | PRMU2021-84 |
発行日 | 2022-03-03 (PRMU) |
研究会情報 | |
研究会 | PRMU / IPSJ-CVIM |
---|---|
開催期間 | 2022/3/10(から2日開催) |
開催地(和) | オンライン開催 |
開催地(英) | Online |
テーマ(和) | 微分可能レンダリング |
テーマ(英) | Differentiable rendering |
委員長氏名(和) | 内田 誠一(九大) |
委員長氏名(英) | Seiichi Uchida(Kyushu Univ.) |
副委員長氏名(和) | 岩村 雅一(阪府大) / 安倍 満(デンソーアイティーラボラトリ) |
副委員長氏名(英) | Masakazu Iwamura(Osaka Pref. Univ.) / Mitsuru Anpai(Denso IT Lab.) |
幹事氏名(和) | 柴田 剛志(NTT) / 西山 正志(鳥取大) |
幹事氏名(英) | Takashi Shibata(NTT) / Masashi Nishiyama(Tottori Univ.) |
幹事補佐氏名(和) | 山口 光太(サイバーエージェント) / 松井 勇佑(東大) |
幹事補佐氏名(英) | Kouta Yamaguchi(CyberAgent) / Yusuke Matsui(Univ. of Tokyo) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Pattern Recognition and Media Understanding / Special Interest Group on Computer Vision and Image Media |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | クエリベースのアンカーを用いた人間と物体のインタラクション検出 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | HOI検出 / Transformer |
第 1 著者 氏名(和/英) | 陳 俊文 / Junwen Chen |
第 1 著者 所属(和/英) | 電気通信大学(略称:電通大) The University of Electro-Communications(略称:UEC) |
第 2 著者 氏名(和/英) | 柳井 啓司 / Keiji Yanai |
第 2 著者 所属(和/英) | 電気通信大学(略称:電通大) The University of Electro-Communications(略称:UEC) |
発表年月日 | 2022-03-11 |
資料番号 | PRMU2021-84 |
巻番号(vol) | vol.121 |
号番号(no) | PRMU-427 |
ページ範囲 | pp.151-156(PRMU), |
ページ数 | 6 |
発行日 | 2022-03-03 (PRMU) |