講演名 2018-03-09
ソーティングを用いた部分列数え上げ符号化法
太田 隆博(長野県工科短大), 眞田 亜紀子(電通大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 部分列数え上げ符号化法(Compression by Substring Enumeration, CSE法)は,無ひずみデータ圧縮法の一つであり,ファイル処理をビット単位で行う2値CSE法とバイト単位で行う多値CSE法に分類できる.多値CSE法については,アルファベットの拡張により,バイト列を直接取り扱える長所と符号化アルゴリズムの拡張の余地がある一方で,2値CSE法と比べて圧縮率が劣る問題点がある.従来の多値CSE手法では,2値CSE法の単純な拡張なため,符号化を行う際に符号化対象となる記号列を辞書式順序で取り扱っている.本稿では,圧縮率を改善するために,符号化済みの記号列の出現回数でソーティングした順序で取り扱う手法を提案する.Calgary corpusのファイル群(14ファイル)に対する計算機実験の結果,提案手法は従来手法と比べて12ファイルで圧縮率(2ファイルは同じ)が改善し,最大で9%改善した.また,高性能な圧縮手法であるbzip2に対して,11ファイルで同等以上の圧縮率が得られた.
抄録(英) This paper proposes an improved compression by substring enumeration (CSE) with a finite alphabet. For an input string, the conventional algorithm encode its substrings including minimal forbidden words in lexicographical order. For improving compression ratios, the proposed algorithm encodes its substrings which are sorted by frequencies of proper their prefixes and suffixes. Experimental results show that compression ratios of the proposed algorithm are better than or equal to those of a conventional algorithm with a finite alphabet and well-known high-performance compressor bzip2 for all files and 11 files in 14 files of Calgary corpus, respectively.
キーワード(和) 部分列数え上げ符号化法 / 圧縮率 / 整列 / データ圧縮
キーワード(英) CSE / Compression Ratio / Sorting / Data Compression
資料番号 IT2017-135,ISEC2017-123,WBS2017-116
発行日 2018-03-01 (IT, ISEC, WBS)

研究会情報
研究会 WBS / IT / ISEC
開催期間 2018/3/8(から2日開催)
開催地(和) 東京理科大(葛飾キャンパス)
開催地(英) Katsusika Campas, Tokyo University of Science
テーマ(和) IT・ISEC・WBS合同研究会
テーマ(英) joint meeting of IT, ISEC, and WBS
委員長氏名(和) 前原 文明(早大) / 大橋 正良(福岡大) / 小川 一人(NHK)
委員長氏名(英) Fumiaki Maehara(Waseda Univ.) / Masayoshi Ohashi(Fukuoka Univ.) / Kazuto Ogawa(NHK)
副委員長氏名(和) 浜村 昌則(高知工科大) / 小野 文枝(NICT) / 村松 純(NTT) / 藤岡 淳(神奈川大) / 盛合 志帆(NICT)
副委員長氏名(英) Masanori Hamamura(Kochi Univ. of Tech.) / Fumie Ono(NICT) / Jun Muramatsu(NTT) / Atsushi Fujioka(Kanagawa Univ.) / Shiho Moriai(NICT)
幹事氏名(和) 能田 康義(三菱電機) / 小澤 佑介(茨城大) / 吉田 隆弘(横浜商科大) / 八木 秀樹(電通大) / 水木 敬明(東北大) / 大東 俊博(東海大)
幹事氏名(英) Yasunori Nouda(Mitsubishi Electric) / Yusuke Kozawa(Ibaraki Univ.) / Takahiro Yoshida(Yokohama College of Commerce) / Hideki Yagi(UEC) / Takaaki Mizuki(Tohoku Univ.) / Toshihiro Ohigashi(Tokai Univ.)
幹事補佐氏名(和) 中村 聡(東京理科大) / 中村 僚兵(防衛大) / 葛岡 成晃(和歌山大) / 江村 恵太(NICT) / 駒野 雄一(東芝) / 須賀 祐治(インターネットイニシアティブ)
幹事補佐氏名(英) Akira Nakamura(Tokyo Univ. of Science) / Ryohei Nakamura(National Defense Academy) / Sigeaki Kuzuoka(wakayama univ.) / Keita Emura(NICT) / Yuichi Komano(TOSHIBA) / Yuuji Suga(IIJ)

講演論文情報詳細
申込み研究会 Technical Committee on Wideband System / Technical Committee on Information Theory / Technical Committee on Information Security
本文の言語 JPN
タイトル(和) ソーティングを用いた部分列数え上げ符号化法
サブタイトル(和)
タイトル(英) Improved Lossless Compression by Substring Enumeration Using Sorting
サブタイトル(和)
キーワード(1)(和/英) 部分列数え上げ符号化法 / CSE
キーワード(2)(和/英) 圧縮率 / Compression Ratio
キーワード(3)(和/英) 整列 / Sorting
キーワード(4)(和/英) データ圧縮 / Data Compression
第 1 著者 氏名(和/英) 太田 隆博 / Takahiro Ota
第 1 著者 所属(和/英) 長野県工科短期大学校(略称:長野県工科短大)
Nagano Prefectural Institute of Technology(略称:NPIT)
第 2 著者 氏名(和/英) 眞田 亜紀子 / Akiko Manada
第 2 著者 所属(和/英) 電気通信大学(略称:電通大)
The University of Electro-Communications(略称:UEC)
発表年月日 2018-03-09
資料番号 IT2017-135,ISEC2017-123,WBS2017-116
巻番号(vol) vol.117
号番号(no) IT-487,ISEC-488,WBS-489
ページ範囲 pp.191-196(IT), pp.191-196(ISEC), pp.191-196(WBS),
ページ数 6
発行日 2018-03-01 (IT, ISEC, WBS)