ラティスベクトル量子化を用いたHyperpriorに基づく変分オートエンコーダ型画像圧縮手法

工藤 忍; 坂東 幸浩; 高村 誠之; 北原 正樹

講演名	2022-11-25 ラティスベクトル量子化を用いたHyperpriorに基づく変分オートエンコーダ型画像圧縮手法工藤忍(NTT), 坂東幸浩(NTT), 高村誠之(NTT/法政大), 北原正樹(NTT),
PDFダウンロードページ	PDFダウンロードページへ
抄録(和)	従来のHyperpriorに基づく変分オートエンコーダ(VAE)型画像圧縮手法では潜在変数の量子化にスカラー量子化が用いられている．スカラー量子化よりもRD性能の高いベクトル量子化(VQ)を適用することで改善の余地があると考えられるが，Hyperpriorに基づくVAE型画像圧縮手法にVQを組み込むには尤度推定が問題となるため，これまで実現した手法はなかった．本稿ではHyperpriorに基づくVAE型画像圧縮手法へのVQ導入を実現する手法を提案する．提案手法ではVQの一種であるラティスVQを導入し，尤度計算をモンテカルロ積分で近似することで上記問題を解決し，End-to-End最適化を実現する．さらに潜在変数ベクトルを多変量正規分布でモデル化することで尤度推定精度の向上を図る．実験により最新の映像符号化規格H.266/VVCの参照ソフトであるVTM 15.0を18.0 %上回る符号化効率を達成した．
抄録(英)
キーワード(和)	画像圧縮 / 深層学習 / 変分オートエンコーダ / ベクトル量子化
キーワード(英)
資料番号	CS2022-57,IE2022-45
発行日	2022-11-17 (CS, IE)

研究会情報
研究会	CS / IE / IPSJ-AVM / ITE-BCT
開催期間	2022/11/24(から2日開催)
開催地（和）	名古屋工業大学
開催地（英）	Nagoya Institute of Technology
テーマ（和）	画像符号化，通信・ストリーム技術，一般
テーマ（英）	Image coding, Communications and streaming technologies, etc.
委員長氏名（和）	梅原大祐(京都工繊大) / 児玉和也(NII) / 笠井裕之(早稲田大学)
委員長氏名（英）	Daisuke Umehara(Kyoto Inst. of Tech.) / Kazuya Kodama(NII) / Hiroyuki Kasai(Waseda University)
副委員長氏名（和）	小崎成治(三菱電機) / 坂東幸浩(NTT) / 山崎俊彦(東大)
副委員長氏名（英）	Seiji Kozaki(Mitsubishi Electric) / Hiroyuki Bandoh(NTT) / Toshihiko Yamazaki(Univ. of Tokyo)
幹事氏名（和）	鎌倉浩嗣(千葉工大) / 原一貴(NTT) / 海野恭平(KDDI総合研究所) / 福嶋慶繁(名工大) / 徐建鋒(KDDI総合研究所) / 松村誠明(NTT) / 金井謙治(早稲田大学)
幹事氏名（英）	Koji Kamakura(Chiba Inst. of Tech.) / Kazutaka Hara(NTT) / Kyohei Unno(KDDI Research) / Norishige Fukushima(Nagoya Inst. of Tech.) / Xu Jianfeng(KDDI Research, Inc.) / Masaaki Matsumura(NTT) / Kenji Kanai(Waseda University)
幹事補佐氏名（和）	川崎耀(NICT) / 井田悠太(山口大) / 岩村俊輔(NHK) / 工藤忍(NTT)
幹事補佐氏名（英）	Hikaru Kawasaki(NICT) / Yuta Ida(Yamaguchi Univ.) / Shunsuke Iwamura(NHK) / Shinobu Kudo(NTT)

講演論文情報詳細
申込み研究会	Technical Committee on Communication Systems / Technical Committee on Image Engineering / Special Interest Group on Audio Visual and Multimedia Information Processing / Technical Group on Broadcasting Technology
本文の言語	JPN-ONLY
タイトル（和）	ラティスベクトル量子化を用いたHyperpriorに基づく変分オートエンコーダ型画像圧縮手法
サブタイトル（和）
タイトル（英）
サブタイトル（和）
キーワード(1)（和/英）	画像圧縮
キーワード(2)（和/英）	深層学習
キーワード(3)（和/英）	変分オートエンコーダ
キーワード(4)（和/英）	ベクトル量子化
第 1 著者氏名（和/英）	工藤忍 / Shinobu Kudo
第 1 著者所属（和/英）	日本電信電話株式会社(略称：NTT) Nippon Telegraph and Telephone Corporation(略称：NTT)
第 2 著者氏名（和/英）	坂東幸浩 / Yukihiro Bandoh
第 2 著者所属（和/英）	日本電信電話株式会社(略称：NTT) Nippon Telegraph and Telephone Corporation(略称：NTT)
第 3 著者氏名（和/英）	高村誠之 / Seishi Takamura
第 3 著者所属（和/英）	日本電信電話株式会社/法政大学(略称：NTT/法政大) Nippon Telegraph and Telephone Corporation/Hosei University(略称：NTT/Hosei Univ.)
第 4 著者氏名（和/英）	北原正樹 / Masaki Kitahara
第 4 著者所属（和/英）	日本電信電話株式会社(略称：NTT) Nippon Telegraph and Telephone Corporation(略称：NTT)
発表年月日	2022-11-25
資料番号	CS2022-57,IE2022-45
巻番号（vol）	vol.122
号番号（no）	CS-269,IE-270
ページ範囲	pp.51-56(CS), pp.51-56(IE),
ページ数	6
発行日	2022-11-17 (CS, IE)