講演名 | 2018-09-27 [特別講演]光線空間の符号化撮影 高橋 桂太(名大), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 光線空間は,高密度な多視点画像で表現され,様々な応用を持つ.光線空間の取得は,画像枚数の増大に伴い,挑戦的な課題となる.その取得を効率化する一つの方法は,符号化開口カメラを用いることである.すわなち,このカメラで開口パターンを変えつつ何枚かの画像を撮影し,それらの画像から計算によって光線空間全体を復元する.わずかな枚数の撮影画像から高品質な光線空間を得るためには,開口パターンと対応する復元アルゴリズムの設計が鍵となる.従来,この問題は,圧縮センシングの文脈から議論されてきた.すなわち,撮影画像を実現し得るような光線空間のパターンのうち,あらかじめ学習された辞書や基底を用いてよりスパースに表現できるものを求めることで,元の光線空間と思われる信号を復元する.一方,我々は,少数の重要な基底のみを事前に選択しておき,効率的な撮影および復元を行う手法を提案した.基底の選択には主成分分析と非負値行列因子分解を用いた.さらに別のアプローチとして,我々は,深層学習を用いた枠組みも提案した.この枠組みでは,光線空間の撮影と復元はオートエンコーダとして定式化され,訓練データを用いて全体が最適化される.シミュレーションおよび実機のカメラを用いた実験の両方で,提案手法の有効性を確認した. |
抄録(英) | A light field, which is often understood as a set of dense multi-view images, has been utilized in various 2D/3D applications. Acquiring a light field is a challenging task due to the amount of data. To make the acquisition process efficient, coded aperture cameras were successfully adopted; using these cameras, a light field is computationally reconstructed from several images that are acquired with different aperture patterns. However, it is still difficult to reconstruct a high-quality light field from only a few acquired images. Previously, this problem has often been discussed from the context of compressed sensing (CS), where sparse representations on a pre-trained dictionary or basis are explored to reconstruct the light field. We first took an approach to this problem from the perspective of principal component analysis (PCA) and non-negative matrix factorization (NMF), where only a small number of basis vectors are selected in advance based on the analysis of the training dataset. We also proposed a learning-based framework, where the entire pipeline of light field acquisition was formulated from the perspective of an auto-encoder that can be trained end-to-end by using a collection of training samples. We obtained promising results both with simulative experiments and a real camera prototype. |
キーワード(和) | 光線空間 / 符号化開口 / 主成分分析 / 非負値行列因子分解 / 深層学習 / 圧縮センシング |
キーワード(英) | Light field / Coded aperture / PCA / NMF / Deep learing / Compressed sensing |
資料番号 | LOIS2018-15,IE2018-35,EMM2018-54 |
発行日 | 2018-09-20 (LOIS, IE, EMM) |
研究会情報 | |
研究会 | IEE-CMN / EMM / LOIS / IE / ITE-ME |
---|---|
開催期間 | 2018/9/27(から2日開催) |
開催地(和) | ビーコンプラザ(別府国際コンベンションセンター) |
開催地(英) | Beppu Int'l Convention Ctr. aka B-CON Plaza |
テーマ(和) | マルチメディア通信/システム,ライフログ活用技術,IP放送/映像伝送,メディアセキュリティ,メディア処理(AI,深層学習),一般 |
テーマ(英) | Multimedia Communication/System, Lifelog Applications, IP Broadcasting/Video Transmission, Media Security, Media Processing (AI, Deep Learning), etc. |
委員長氏名(和) | 森村 俊(電中研) / 岩村 惠市(東京理科大) / 山田 智広(NTT) / 浜本 隆之(東京理科大) / 長谷山 美紀(北大) |
委員長氏名(英) | Shun Morimura(CRIEPI) / Keiichi Iwamura(TUC) / Tomohiro Yamada(NTT) / Takayuki Hamamoto(Tokyo Univ. of Science) / Miki Haseyama(北大) |
副委員長氏名(和) | / 栗林 稔(岡山大) / 小嶋 徹也(東京高専) / 小林 透(長崎大) / 木全 英明(NTT) / 児玉 和也(NII) / 田川 憲男(首都大東京) |
副委員長氏名(英) | / Minoru Kuribayashi(Okayama Univ.) / Tetsuya Kojima(NIT,Tokyo College) / Toru Kobayashi(Nagasaki Univ.) / Hideaki Kimata(NTT) / Kazuya Kodama(NII) / Norio Tagawa(Tokyo Metropolitan Univ.) |
幹事氏名(和) | 宇津 圭祐(東海大) / 平田 孝志(関西大) / 姜 玄浩(東京高専) / 村田 晴美(中京大) / 中村 幸博(NTT) / 岡本 基(情報・システム研究機構) / 河村 圭(KDDI総合研究所) / 高橋 桂太(名大) / 新井 啓之(日本工大) |
幹事氏名(英) | Keisuke Utsu(Tokai Univ.) / Koji Hirata(Kansai Univ.) / Kan Hyonho(NIT, Tokyo) / Harumi Murata(Chukyo Univ.) / Yukihiro Nakamura(NTT) / Motoi Okamoto(Research Organization of Information and Systems) / Kei Kawamura(KDDI Research) / Keita Takahashi(Nagoya Univ.) / Hiroyuki Arai(日本工大) |
幹事補佐氏名(和) | 木村 共孝(同志社大) / 田中 彰浩(電中研) / 秋山 寛子(長野高専) / 金田 北洋(キヤノン) / 永徳 真一郎(NTT) / 早瀬 和也(NTT) / 松尾 康孝(NHK) |
幹事補佐氏名(英) | Tomotaka Kimura(Doshisha Univ.) / 田中 彰浩(CRIEPI) / Hiroko Akiyama(NIT, Nagano College) / Kitahiro Kaneda(CANON) / Shinichiro Eitoku(NTT) / Kazuya Hayase(NTT) / Yasutaka Matsuo(NHK) |
講演論文情報詳細 | |
申込み研究会 | Technical Meeting on Communications / Technical Committee on Enriched MultiMedia / Technical Committee on Life Intelligence and Office Information Systems / Technical Committee on Image Engineering / Technical Group on Media Engineering |
---|---|
本文の言語 | JPN |
タイトル(和) | [特別講演]光線空間の符号化撮影 |
サブタイトル(和) | 基底表現から深層学習へ |
タイトル(英) | [Special Talk] Coded Acquistion of Light Fields |
サブタイトル(和) | From Basis Representation to Deep Learning |
キーワード(1)(和/英) | 光線空間 / Light field |
キーワード(2)(和/英) | 符号化開口 / Coded aperture |
キーワード(3)(和/英) | 主成分分析 / PCA |
キーワード(4)(和/英) | 非負値行列因子分解 / NMF |
キーワード(5)(和/英) | 深層学習 / Deep learing |
キーワード(6)(和/英) | 圧縮センシング / Compressed sensing |
第 1 著者 氏名(和/英) | 高橋 桂太 / Keita Takahashi |
第 1 著者 所属(和/英) | 名古屋大学(略称:名大) Nagoya University(略称:Nagoya Univ.) |
発表年月日 | 2018-09-27 |
資料番号 | LOIS2018-15,IE2018-35,EMM2018-54 |
巻番号(vol) | vol.118 |
号番号(no) | LOIS-222,IE-223,EMM-224 |
ページ範囲 | pp.29-30(LOIS), pp.29-30(IE), pp.29-30(EMM), |
ページ数 | 2 |
発行日 | 2018-09-20 (LOIS, IE, EMM) |