講演名 2021-03-04
CSE法における再構成可能な部分文字列の十分条件に関する一考察
田中 駿伍(岐阜大), 鎌部 浩(岐阜大), 路 サン(岐阜大),
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 様々なデータ圧縮方法が提案されており,これらは圧縮データからもとのデータを完全に復元することができる可逆圧縮法と,もとのデータを完全には復元できない不可逆圧縮法に大別することができる.本研究で扱う圧縮法は可逆圧縮法の一種である部分文字列数え上げデータ圧縮法(Compression via Substring Enumeration,以降CSE法) と呼ばれる手法で,Dub?らによって提案された.CSE法はバイナリ文字列を対象にした圧縮法であり,良好な圧縮率を有することが報告されている.CSE法では圧縮対象となる文字列に含まれる部分文字列の出現数を数え上げることで符号化を行う.嶋らによるCSEにおけるある改良では,この部分文字列の数え上げの条件式を改善することでDub?らによって提案されたCSE法に比べ,ある作為的な情報源について圧縮率が良くなることを示した.本研究では,部分文字列の出現数を数え上げる際,CSTと呼ばれるグラフ構造を作成しながら符号化を行い,ノードを作成する度にCSTの根から全探索を行い,長さnとなる文字列が見つかった時点で符号化を終了することによって符号化する部分文字列の個数を削減し,ハフマン符号化による圧縮を行うことで圧縮率の向上を目指す.また,提案手法と既存の手法を比較して符号化率を評価する.
抄録(英) Various data compression methods have been proposed, which can be roughly classified into two cat-egories: lossless compression methods that can completely recover the original data from compressed data andirreversible compression methods that cannot completely recover the original data. In this study, we focus on acompression method called Compression via Substring Enumeration (CSE) , which is a kind of lossless compressionmethod proposed by Dub? et al. In the CSE method, encoding is performed by counting the number of occurrencesof substrings in the string to be compressed. In one improvement of CSE by Shima et al. , it was shown thatby improving the conditional expression of the substring counting, the compression ratio is better than that of theCSE method proposed by Dub? et al. for some random information sources. In this study, the number of substringsto be encoded is reduced by creating a graph structure called CST when counting the number of occurrences ofsubstrings, conducting a full search from the root of the CST each time a node is created, and terminating the en-coding when a string of length n is found. The number of substrings to be encoded is reduced, and the compressionratio is improved by Huffman coding. Besides, we evaluate the coding rate by comparing the proposed method withexisting methods.
キーワード(和) CSE法 / 部分文字列数え上げ / 圧縮率
キーワード(英) Compression via Substring Enumeration / Substring enumeration / compression ratio
資料番号 IT2020-116,ISEC2020-46,WBS2020-35
発行日 2021-02-25 (IT, ISEC, WBS)

研究会情報
研究会 WBS / IT / ISEC
開催期間 2021/3/4(から2日開催)
開催地(和) オンライン開催
開催地(英) Online
テーマ(和) WBS・IT・ISEC合同研究会
テーマ(英) Joint Meeting of WBS, IT, and ISEC
委員長氏名(和) 浜村 昌則(高知工科大) / 和田山 正(名工大) / 廣瀬 勝一(福井大)
委員長氏名(英) Masanori Hamamura(Kochi Univ. of Tech.) / Tadashi Wadayama(Nagoya Inst. of Tech.) / Shoichi Hirose(Univ. of Fukui)
副委員長氏名(和) 庄納 崇(インテル) / 藤井 雅弘(宇都宮大) / 小嶋 徹也(東京高専) / 伊豆 哲也(富士通研) / 國廣 昇(筑波大学)
副委員長氏名(英) Takashi Shono(INTEL) / Masahiro Fujii(Utsunomiya Univ.) / Tetsuya Kojima(Tokyo Kosen) / Tetsuya Izu(Fujitsu Labs.) / Noboru Kunihiro(Tsukuba Univ.)
幹事氏名(和) 荒井 伸太郎(岡山理科大) / 中村 僚兵(防衛大) / 野崎 隆之(山口大) / 廣友 雅徳(佐賀大) / 面 和成(筑波大) / 山本 大(富士通研)
幹事氏名(英) Shintaro Arai(Okayama Univ. of Science) / Ryohei Nakamura(National Defence Academy) / Takayuki Nozaki(Yamaguchi Univ.) / Masanori Hirotomo(Saga Univ.) / Kazunari Omote(Tsukuba Univ.) / Dai Yamamoto(Fujitsu Labs.)
幹事補佐氏名(和) Duong Quang Thang(奈良先端大) / 森山 雅文(NICT) / 木下 雅之(千葉工大) / 太田 隆博(専修大) / 米山 一樹(茨城大)
幹事補佐氏名(英) Duong Quang Thang(NAIST) / Masafumi Moriyama(NICT) / Masayuki Kinoshita(Chiba Univ. of Tech.) / Takahiro Ohta(Senshu Univ.) / Kazuki Yoneyama(Ibaraki Univ.)

講演論文情報詳細
申込み研究会 Technical Committee on Wideband System / Technical Committee on Information Theory / Technical Committee on Information Security
本文の言語 JPN
タイトル(和) CSE法における再構成可能な部分文字列の十分条件に関する一考察
サブタイトル(和)
タイトル(英) A note on sufficient condition for reconstructable substring of CSE method
サブタイトル(和)
キーワード(1)(和/英) CSE法 / Compression via Substring Enumeration
キーワード(2)(和/英) 部分文字列数え上げ / Substring enumeration
キーワード(3)(和/英) 圧縮率 / compression ratio
第 1 著者 氏名(和/英) 田中 駿伍 / Shungo Tanaka
第 1 著者 所属(和/英) 岐阜大学(略称:岐阜大)
Gifu University(略称:Gifu Univ.)
第 2 著者 氏名(和/英) 鎌部 浩 / Hiroshi Kamabe
第 2 著者 所属(和/英) 岐阜大学(略称:岐阜大)
Gifu University(略称:Gifu Univ.)
第 3 著者 氏名(和/英) 路 サン / Shan Lu
第 3 著者 所属(和/英) 岐阜大学(略称:岐阜大)
Gifu University(略称:Gifu Univ.)
発表年月日 2021-03-04
資料番号 IT2020-116,ISEC2020-46,WBS2020-35
巻番号(vol) vol.120
号番号(no) IT-410,ISEC-411,WBS-412
ページ範囲 pp.25-30(IT), pp.25-30(ISEC), pp.25-30(WBS),
ページ数 6
発行日 2021-02-25 (IT, ISEC, WBS)