講演名 2010-05-13
一人称ビジョンシステムのための自己位置推定法(テーマ,First Person Visionのための認識・理解)
山崎 俊太郎, 持丸 正明, 金出 武雄,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 一人称ビジョンシステムの一つである,頭部装着型の単眼カメラを用いて,画像から自己位置を推定する方法を提案する.本報告では,移動環境が既知であると仮定し,オフライン処理で環境地図を作成し,地図中での位置の推定をオンラインで行う,2ステップの手法について述べる.地図作成ステップでは,未校正の画像集合から,Structure-from-Motion法を用いてカメラ位置を復元する.続いて,多視点ステレオ法を用いて密な3次元点集合を生成する.復元した3次元点の座標,対応する画像特徴,その観測方向の3つ組からなる画像特徴データベースを作成し,画像特徴をキーとして検索可能な木構造に格納する.位置推定ステップでは,単眼カメラの計測画像から抽出した画像特徴を利用して木構造を探索し,環境中の3次元点との対応を取得する.得られた対応点を元に,ロバスト推定によってカメラの姿勢を復元する.実験では,500以上の画像から大規模な環境地図を生成さし,頭部に装着したカメラの位置をオンラインで,cm精度で求められることを示す.本手法を用いることにより,利用者に負担を与えない単純な計測装置で,人間の日常生活行動を長期間にわたり観測することが可能になる.
抄録(英) We describe a method of image-based localization suitable for the First-Person Vision system composed of a single head-mounted video camera. Assuming the camera motion is within a known environment, mapping and localization are conducted in two separate processes. In mapping, the 3D structure of the environment is reconstructed from uncalibrated images using a Structure-from-Motion technique. The structure is then refined by a multi-view stereo algorithm. Each point in the reconstructed 3D point cloud are associated with the corresponding image features, composing a set of triplets of 3D point, image feature, and viewing direction. The mapping process is time consuming and conducted in advance. Localization, on the other hand, can be at an interactive speed taking advantage of the precomputed triplets. First, image features are extracted given an image acquired by a head-mounted camera. The corresponding points in the environment are sought using the features as query keys, and matched to estimate the camera pose in the environment. We demonstrate that a large environment map is created using more than 500 images, and the localization is with centimeter accuracy and at an interactive speed. We believe our sensing system is simple and accurate, and therefore suitable for activity modeling and behavior understanding in everyday life environment.
キーワード(和) 一人称ビジョン / 地図作成 / 自己位置推定 / Structure-from-Motion / 多視点ステレオ / SIFT / 実時間
キーワード(英) First-Person Vision / mapping / localization / Structure-from-Motion / Multi-View Stereo / SIFT / realtime
資料番号 IE2010-27,PRMU2010-15,MI2010-15
発行日

研究会情報
研究会 MI
開催期間 2010/5/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Medical Imaging (MI)
本文の言語 JPN
タイトル(和) 一人称ビジョンシステムのための自己位置推定法(テーマ,First Person Visionのための認識・理解)
サブタイトル(和)
タイトル(英) Visual Localization for First-person Vision System
サブタイトル(和)
キーワード(1)(和/英) 一人称ビジョン / First-Person Vision
キーワード(2)(和/英) 地図作成 / mapping
キーワード(3)(和/英) 自己位置推定 / localization
キーワード(4)(和/英) Structure-from-Motion / Structure-from-Motion
キーワード(5)(和/英) 多視点ステレオ / Multi-View Stereo
キーワード(6)(和/英) SIFT / SIFT
キーワード(7)(和/英) 実時間 / realtime
第 1 著者 氏名(和/英) 山崎 俊太郎 / Shuntaro YAMAZAKI
第 1 著者 所属(和/英) 産業技術総合研究所デジタルヒューマン工学研究センター
National Institute of Advanced Industrial Science and Technology
第 2 著者 氏名(和/英) 持丸 正明 / Masaaki MOCHIMARU
第 2 著者 所属(和/英) 産業技術総合研究所デジタルヒューマン工学研究センター
National Institute of Advanced Industrial Science and Technology
第 3 著者 氏名(和/英) 金出 武雄 / Takeo KANADE
第 3 著者 所属(和/英) 産業技術総合研究所デジタルヒューマン工学研究センター
National Institute of Advanced Industrial Science and Technology
発表年月日 2010-05-13
資料番号 IE2010-27,PRMU2010-15,MI2010-15
巻番号(vol) vol.110
号番号(no) 28
ページ範囲 pp.-
ページ数 6
発行日