講演名 2022-03-10
[特別講演]インペイント処理向け深層予測器を用いた画像の可逆符号化
高橋 桂太(名大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本発表は,2020年度IE特別賞を授与された筆者らの発表を紹介し,今後の研究の方向性を議論するものである.画像の可逆符号化における符号化効率は,処理済みの画素から未知画素の画素値の確率分布を予測する予測器の性能に依存する.近年,大量の学習データを用いて深層学習の枠組みで予測器を最適化する,深層予測器が注目されている.本研究では,符号化効率と計算速度の両立をめざす観点から,深層予測器における画素の処理順に着目した.従来手法では,左上画素からラスタ順に画素の予測と符号化を行うため,予測器の参照領域は対象画素の上側に制限される.また,復号時には予測と復号を画素単位で逐次的に行う必要があるため,多大の計算時間を要する.一方,筆者らは,画像の全体を参照しつつ複数の画素を同時に予測する深層予測器を構築した.この予測器は,インペイント処理に用いられる深層CNNを多段階に積層することで,徐々に処理済み画素の割合を増やしていく構成とした.実験により,我々の深層予測器は,従来のラスタ順の深層予測器に匹敵する符号化効率を達成しつつ,復号時の計算時間を大幅に削減できることがわかった.
抄録(英) I will be presenting our previous paper that received IE special Award 2020 to encourage discussions for future directions. The coding efficiency of lossless image coding methods depends on the pixel predictor that is designed to predict probabilistic distributions for unknown pixels from the already-processed pixels. Recently, more attention is given to deep pixel predictors, which are optimized using abundant training data under the framework of deep learning. To achieve high coding efficiency and fast computation speed, we focus on the processing order of pixels in deep pixel predictors. In previous works, the image pixels are usually processed in the raster-scan order starting from the top-left pixel. This processing order restricts the reference area used to predict a target pixel only to the upper part of that pixel. Moreover, due to this processing order, the pixels need to be predicted and decoded one by one at the decoding time, which incurs significant computation time. Meanwhile, we construct a deep pixel predictor that can predict multiple target pixels simultaneously by referring to the pixels located at all the directions with respect to the target pixels. Our pixel predictor is designed as a stack of deep CNNs that were used for image inpainting task, in which the number of the processed pixels gradually increases as the image undergoes more CNNs. Our experimental results show that our inpainting-oriented predictor can achieve the coding efficiency comparable to that of the raster-scan order counterpart and substantially decrease the computation time required for the decoding process.
キーワード(和) 可逆画像符号化 / 深層予測器 / インペイント処理
キーワード(英) Lossless image coding / Deep pixel predictor / image inpainting
資料番号 IMQ2021-31,CQ2021-122,IE2021-93,MVE2021-60
発行日 2022-03-02 (IMQ, CQ, IE, MVE)

研究会情報
研究会 CQ / IMQ / MVE / IE
開催期間 2022/3/9(から3日開催)
開催地(和) オンライン開催(Zoom)
開催地(英) Online (Zoom)
テーマ(和) 変化する生活での五感に訴えるオンラインメディアとその評価、および一般(魅力工学研究会協賛)
テーマ(英) Media of five senses, Multimedia, Media experience, Picture codinge, Image media quality, Network,quality and reliability, etc
委員長氏名(和) 岡本 淳(NTT) / 魚森 謙也(阪大) / 井原 雅行(理研) / 児玉 和也(NII)
委員長氏名(英) Jun Okamoto(NTT) / Kenya Uomori(Osaka Univ.) / Masayuki Ihara(RIKEN) / Kazuya Kodama(NII)
副委員長氏名(和) 平栗 健史(日本工大) / 長谷川 剛(東北大) / 前田 充(キヤノン) / 清川 清(奈良先端大) / 坂東 幸浩(NTT) / 山崎 俊彦(東大)
副委員長氏名(英) Takefumi Hiraguri(Nippon Inst. of Tech.) / Gou Hasegawa(Tohoku Univ.) / Mitsuru Maeda(Canon) / Kiyoshi Kiyokawa(NAIST) / Hiroyuki Bandoh(NTT) / Toshihiko Yamazaki(Univ. of Tokyo)
幹事氏名(和) アベセカラ ヒランタ(NTT) / 山本 寛(立命館大) / 工藤 博章(名大) / 土田 勝(NTT) / 西口 敏司(阪工大) / 横山 正典(NTT) / 福嶋 政期(東大) / 海野 恭平(KDDI総合研究所) / 福嶋 慶繁(名工大)
幹事氏名(英) Hirantha Abeysekera(NTT) / Hiroshi Yamamoto(Ritsumeikan Univ.) / Hiroaki Kudo(Nagoya Univ.) / Masaru Tsuchida(NTT) / Satoshi Nishiguchi(Oosaka Inst. of Tech.) / Masanori Yokoyama(NTT) / Shogo Fukushima(Univ. of ToKyo) / Kyohei Unno(KDDI Research) / Norishige Fukushima(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 西川 由明(NEC) / 堅岡 良知(KDDI総合研究所) / 川嶋 喜美子(NTT) / 塚田 正人(NEC) / 山添 崇(成蹊大) / 磯山 直也(奈良先端大) / 原 豪紀(大日本印刷) / 後藤 充裕(NTT) / 岩村 俊輔(NHK) / 工藤 忍(NTT)
幹事補佐氏名(英) Yoshiaki Nishikawa(NEC) / Ryoichi Kataoka(KDDI Research) / Kimiko Kawashima(NTT) / Masato Tsukada(NEC) / Takashi Yamazoe(Seikei Univ.) / Naoya Isoyama(NAIST) / Takenori Hara(DNP) / Mitsuhiro Goto(NTT) / Shunsuke Iwamura(NHK) / Shinobu Kudo(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Communication Quality / Technical Committee on Image Media Quality / Technical Committee on Media Experience and Virtual Environment / Technical Committee on Image Engineering
本文の言語 JPN
タイトル(和) [特別講演]インペイント処理向け深層予測器を用いた画像の可逆符号化
サブタイトル(和)
タイトル(英) [Special Talk] Lossless Image Coding using Inpainting-Oriented Deep Pixel Predictor
サブタイトル(和)
キーワード(1)(和/英) 可逆画像符号化 / Lossless image coding
キーワード(2)(和/英) 深層予測器 / Deep pixel predictor
キーワード(3)(和/英) インペイント処理 / image inpainting
第 1 著者 氏名(和/英) 高橋 桂太 / Keita Takahashi
第 1 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
発表年月日 2022-03-10
資料番号 IMQ2021-31,CQ2021-122,IE2021-93,MVE2021-60
巻番号(vol) vol.121
号番号(no) IMQ-420,CQ-421,IE-422,MVE-423
ページ範囲 pp.114-114(IMQ), pp.124-124(CQ), pp.114-114(IE), pp.114-114(MVE),
ページ数 1
発行日 2022-03-02 (IMQ, CQ, IE, MVE)