講演名 | 2022-11-25 ラティスベクトル量子化を用いたHyperpriorに基づく変分オートエンコーダ型画像圧縮手法 工藤 忍(NTT), 坂東 幸浩(NTT), 高村 誠之(NTT/法政大), 北原 正樹(NTT), |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 従来のHyperpriorに基づく変分オートエンコーダ(VAE)型画像圧縮手法では潜在変数の量子化にスカラー量子化が用いられている.スカラー量子化よりもRD性能の高いベクトル量子化(VQ)を適用することで改善の余地があると考えられるが,Hyperpriorに基づくVAE型画像圧縮手法にVQを組み込むには尤度推定が問題となるため,これまで実現した手法はなかった.本稿ではHyperpriorに基づくVAE型画像圧縮手法へのVQ導入を実現する手法を提案する.提案手法ではVQの一種であるラティスVQを導入し,尤度計算をモンテカルロ積分で近似することで上記問題を解決し,End-to-End最適化を実現する.さらに潜在変数ベクトルを多変量正規分布でモデル化することで尤度推定精度の向上を図る.実験により最新の映像符号化規格H.266/VVCの参照ソフトであるVTM 15.0を18.0 %上回る符号化効率を達成した. |
抄録(英) | |
キーワード(和) | 画像圧縮 / 深層学習 / 変分オートエンコーダ / ベクトル量子化 |
キーワード(英) | |
資料番号 | CS2022-57,IE2022-45 |
発行日 | 2022-11-17 (CS, IE) |
研究会情報 | |
研究会 | CS / IE / IPSJ-AVM / ITE-BCT |
---|---|
開催期間 | 2022/11/24(から2日開催) |
開催地(和) | 名古屋工業大学 |
開催地(英) | Nagoya Institute of Technology |
テーマ(和) | 画像符号化,通信・ストリーム技術,一般 |
テーマ(英) | Image coding, Communications and streaming technologies, etc. |
委員長氏名(和) | 梅原 大祐(京都工繊大) / 児玉 和也(NII) / 笠井 裕之(早稲田大学) |
委員長氏名(英) | Daisuke Umehara(Kyoto Inst. of Tech.) / Kazuya Kodama(NII) / Hiroyuki Kasai(Waseda University) |
副委員長氏名(和) | 小崎 成治(三菱電機) / 坂東 幸浩(NTT) / 山崎 俊彦(東大) |
副委員長氏名(英) | Seiji Kozaki(Mitsubishi Electric) / Hiroyuki Bandoh(NTT) / Toshihiko Yamazaki(Univ. of Tokyo) |
幹事氏名(和) | 鎌倉 浩嗣(千葉工大) / 原 一貴(NTT) / 海野 恭平(KDDI総合研究所) / 福嶋 慶繁(名工大) / 徐 建鋒(KDDI総合研究所) / 松村 誠明(NTT) / 金井 謙治(早稲田大学) |
幹事氏名(英) | Koji Kamakura(Chiba Inst. of Tech.) / Kazutaka Hara(NTT) / Kyohei Unno(KDDI Research) / Norishige Fukushima(Nagoya Inst. of Tech.) / Xu Jianfeng(KDDI Research, Inc.) / Masaaki Matsumura(NTT) / Kenji Kanai(Waseda University) |
幹事補佐氏名(和) | 川崎 耀(NICT) / 井田 悠太(山口大) / 岩村 俊輔(NHK) / 工藤 忍(NTT) |
幹事補佐氏名(英) | Hikaru Kawasaki(NICT) / Yuta Ida(Yamaguchi Univ.) / Shunsuke Iwamura(NHK) / Shinobu Kudo(NTT) |
講演論文情報詳細 | |
申込み研究会 | Technical Committee on Communication Systems / Technical Committee on Image Engineering / Special Interest Group on Audio Visual and Multimedia Information Processing / Technical Group on Broadcasting Technology |
---|---|
本文の言語 | JPN-ONLY |
タイトル(和) | ラティスベクトル量子化を用いたHyperpriorに基づく変分オートエンコーダ型画像圧縮手法 |
サブタイトル(和) | |
タイトル(英) | |
サブタイトル(和) | |
キーワード(1)(和/英) | 画像圧縮 |
キーワード(2)(和/英) | 深層学習 |
キーワード(3)(和/英) | 変分オートエンコーダ |
キーワード(4)(和/英) | ベクトル量子化 |
第 1 著者 氏名(和/英) | 工藤 忍 / Shinobu Kudo |
第 1 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:NTT) |
第 2 著者 氏名(和/英) | 坂東 幸浩 / Yukihiro Bandoh |
第 2 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:NTT) |
第 3 著者 氏名(和/英) | 高村 誠之 / Seishi Takamura |
第 3 著者 所属(和/英) | 日本電信電話株式会社/法政大学(略称:NTT/法政大) Nippon Telegraph and Telephone Corporation/Hosei University(略称:NTT/Hosei Univ.) |
第 4 著者 氏名(和/英) | 北原 正樹 / Masaki Kitahara |
第 4 著者 所属(和/英) | 日本電信電話株式会社(略称:NTT) Nippon Telegraph and Telephone Corporation(略称:NTT) |
発表年月日 | 2022-11-25 |
資料番号 | CS2022-57,IE2022-45 |
巻番号(vol) | vol.122 |
号番号(no) | CS-269,IE-270 |
ページ範囲 | pp.51-56(CS), pp.51-56(IE), |
ページ数 | 6 |
発行日 | 2022-11-17 (CS, IE) |