講演名 2023-02-02
[招待講演]画像符号化におけるDCT係数の符号ビットを圧縮するには?
都竹 千尋(名大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) DCTに基づく画像符号化方式では,DCT係数に伴う符号ビットの発生確率が等しく,その圧縮が課題となっている.これを解決するために,著者らはDCT係数の振幅から符号ビットを復元する手法(符号回復アルゴリズム)を提案している.この手法は,位相回復—DFT係数の振幅から位相を復元する問題—から着想を得たものである.具体的には,位相回復におけるDFT係数の振幅と位相の各々を,DCT係数の振幅と符号ビットに置き換え,位相回復の求解アルゴリズムを介して符号ビットを復元する.符号回復アルゴリズムを応用することで,著者らは符号ビットの圧縮に成功している.具体的には,まずエンコーダでDCT係数の振幅のみを圧縮する.その後,符号回復アルゴリズムを介して符号ビットを復元し,復元誤差(誤り訂正ビット)を圧縮する.復元ビットが高精度であれば,誤り訂正ビットのエントロピーは微小なものとなる.つまり,誤り訂正ビットは圧縮することが可能であり,これを復元ビットに加算することで,符号ビットのロスレス復号が可能である.本稿では,著者らがこれまでに注力してきた符号ビット圧縮の研究を振り返りつつ,著者らの手法が静止画像および動画像符号化において有効であることを報告する.
抄録(英) Compressing the signs of DCT coefficients is an intractable problem in image coding because of their equiprobable characteristics. To overcome this difficulty, we have proposed a novel method named sign retrieval that can restore the signs only from the DCT magnitudes. This method is inspired by a classical image restoration problem referred to as phase retrieval, which aims to find the phases of DFT coefficients only from their magnitudes. More specifically, we regard the DCT magnitudes and signs as the DFT magnitudes and phases in the phase retrieval problem, respectively, and we restore the signs via a phase retrieval solver. We have achieved the sign compression by using our sign retrieval. More specifically, we first compress DCT magnitudes at an encoder; we then restore the signs of DCT coefficients, and finally compress error-correction codes. If the signs can be restored with high accuracy, the error-correction codes have small entropy, i.e., compressible. By adding the error-correction codes to the restored signs, we can obtain the original signs without errors. In this talk, we review our research on the sign compression, and report the effectiveness of our method for still image coding and video one.
キーワード(和) 画像符号化 / 位相回復 / 符号回復 / 符号ビット圧縮 / 凸最適化 / ニューラルネットワーク
キーワード(英) image coding / phase retrieval / sign retrieval / sign compression / convex optimization / neural network
資料番号 IE2022-55
発行日 2023-01-26 (IE)

研究会情報
研究会 IE
開催期間 2023/2/2(から1日開催)
開催地(和) 国立情報学研究所
開催地(英) NII
テーマ(和) 画像工学一般
テーマ(英) Image Processing
委員長氏名(和) 児玉 和也(NII)
委員長氏名(英) Kazuya Kodama(NII)
副委員長氏名(和) 坂東 幸浩(NTT) / 山崎 俊彦(東大)
副委員長氏名(英) Hiroyuki Bandoh(NTT) / Toshihiko Yamazaki(Univ. of Tokyo)
幹事氏名(和) 海野 恭平(KDDI総合研究所) / 福嶋 慶繁(名工大)
幹事氏名(英) Kyohei Unno(KDDI Research) / Norishige Fukushima(Nagoya Inst. of Tech.)
幹事補佐氏名(和) 岩村 俊輔(NHK) / 工藤 忍(NTT)
幹事補佐氏名(英) Shunsuke Iwamura(NHK) / Shinobu Kudo(NTT)

講演論文情報詳細
申込み研究会 Technical Committee on Image Engineering
本文の言語 JPN
タイトル(和) [招待講演]画像符号化におけるDCT係数の符号ビットを圧縮するには?
サブタイトル(和) 位相回復から着想を得た一手法
タイトル(英) [Invited Talk] How Can We Compress Signs of DCT Coefficients in Image Coding?
サブタイトル(和) A Method Inspired by Phase Retrieval
キーワード(1)(和/英) 画像符号化 / image coding
キーワード(2)(和/英) 位相回復 / phase retrieval
キーワード(3)(和/英) 符号回復 / sign retrieval
キーワード(4)(和/英) 符号ビット圧縮 / sign compression
キーワード(5)(和/英) 凸最適化 / convex optimization
キーワード(6)(和/英) ニューラルネットワーク / neural network
第 1 著者 氏名(和/英) 都竹 千尋 / Chihiro Tsutake
第 1 著者 所属(和/英) 名古屋大学(略称:名大)
Nagoya University(略称:Nagoya Univ.)
発表年月日 2023-02-02
資料番号 IE2022-55
巻番号(vol) vol.122
号番号(no) IE-376
ページ範囲 pp.19-19(IE),
ページ数 1
発行日 2023-01-26 (IE)