講演名 2022-01-21
階層的な残差予測に基づくロスレス音声コーデック
峰尾 太陽(電通大), 庄野 逸(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本研究では,Neural Network (NN) の高い予測精度を保ちつつもデコード負荷を低く抑えたモデルを使用したロスレス音声コーデックを提案する.提案モデルは,音声を一定長のフレームで切り出し,その範囲で残差の符号長が短くなるように係数を補助関数法によって設定する.このモデルは残差を繰り返し予測するため,ResNetと同様の構成を持つ.提案手法をコーデックとして実装し,性能比較実験を行った.圧縮率においてMonkey's Audioを除き高い圧縮率を示し,デコード速度は実用的であることを示した.
抄録(英) In this study, we propose a novel lossless audio codec that has precise predictive performance from the neural network and faster decoding speed. The proposed method employs an auxiliary function method to set parameters under the sparse residual constraint. The proposed network structure can be considered as one of the ResNet. We implemented the codec and conducted comparison experiments for state-of-the-art codecs. In the result, we confirmed practical decoding speed and it showed higher compression ability than others except for Monkey's Audio did.
キーワード(和) 音声ロスレス符号化 / 線形予測符号化 / Golomb-Rice符号 / 畳み込みニューラルネットワーク / ResNet
キーワード(英) Lossless Audio Coding / Linear Predictive Coding / Golomb-Rice Coding / Convolutional Neural Network / ResNet
資料番号 IT2021-71,SIP2021-79,RCS2021-239
発行日 2022-01-13 (IT, SIP, RCS)

研究会情報
研究会 RCS / SIP / IT
開催期間 2022/1/20(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) 無線通信のための信号処理,学習,数理,情報理論および一般
テーマ(英)
委員長氏名(和) 岡本 英二(名工大) / 坂東 幸浩(NTT) / 和田山 正(名工大)
委員長氏名(英) Eiji Okamoto(Nagoya Inst. of Tech.) / Yukihiro Bandou(NTT) / Tadashi Wadayama(Nagoya Inst. of Tech.)
副委員長氏名(和) 西村 寿彦(北大) / 旦代 智哉(東芝) / 児島 史秀(NICT) / 田中 聡久(東京農工大) / 仲地 孝之(琉球大学) / 小嶋 徹也(東京高専)
副委員長氏名(英) Toshihiko Nishimura(Hokkaido Univ.) / Tomoya Tandai(Toshiba) / Fumihide Kojima(NICT) / Toshihisa Tanaka(Tokyo Univ. Agri.&Tech.) / Takayuki Nakachi(Ryukyu Univ.) / Tetsuya Kojima(Tokyo Kosen)
幹事氏名(和) 村岡 一志(NEC) / 山本 哲矢(パナソニック) / 杉本 憲治郎(Xiaomi) / 渡辺 修(拓殖大) / 田中 雄一(東京農工大) / 松田 哲直(埼玉大) / 野崎 隆之(山口大)
幹事氏名(英) Kazushi Muraoka(NEC) / Tetsuya Yamamoto(Panasonic) / Kenjiro Sugimoto(Xiaomi) / Osamu Watanabe(Takushoku Univ.) / Yuichi Tanaka(Tokyo Univ. Agri.&Tech.) / Tetsunao Matsuta(Saitamai Univ.) / Takayuki Nozaki(Yamaguchi Univ.)
幹事補佐氏名(和) 安達 宏一(電通大) / 中村 理(シャープ) / 酒井 学(三菱電機) / 岩渕 匡史(NTT) / 奥山 達樹(NTTドコモ) / 吉田 太一(電通大) / 京地 清介(北九州市立大) / 廣友 雅徳(佐賀大)
幹事補佐氏名(英) Koichi Adachi(Univ. of Electro-Comm.) / Osamu Nakamura(Sharp) / Manabu Sakai(Mitsubishi Electric) / Masashi Iwabuchi(NTT) / Tatsuki Okuyama(NTT DOCOMO) / Taichi Yoshida(UEC) / Seisuke Kyochi(Univ. of Kitakyushu) / Masanori Hirotomo(Saga Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Radio Communication Systems / Technical Committee on Signal Processing / Technical Committee on Information Theory
本文の言語 JPN
タイトル(和) 階層的な残差予測に基づくロスレス音声コーデック
サブタイトル(和)
タイトル(英) A lossless audio codec based on hierarchical residual prediction
サブタイトル(和)
キーワード(1)(和/英) 音声ロスレス符号化 / Lossless Audio Coding
キーワード(2)(和/英) 線形予測符号化 / Linear Predictive Coding
キーワード(3)(和/英) Golomb-Rice符号 / Golomb-Rice Coding
キーワード(4)(和/英) 畳み込みニューラルネットワーク / Convolutional Neural Network
キーワード(5)(和/英) ResNet / ResNet
第 1 著者 氏名(和/英) 峰尾 太陽 / Taiyo Mineo
第 1 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
第 2 著者 氏名(和/英) 庄野 逸 / Shouno Hayaru
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2022-01-21
資料番号 IT2021-71,SIP2021-79,RCS2021-239
巻番号(vol) vol.121
号番号(no) IT-327,SIP-328,RCS-329
ページ範囲 pp.239-244(IT), pp.239-244(SIP), pp.239-244(RCS),
ページ数 6
発行日 2022-01-13 (IT, SIP, RCS)