講演名 | 2009-03-10 長さ制限のある極小禁止語を用いた動的な反辞書データ圧縮法(情報通信基礎サブソサイエティ合同研究会) 太田 隆博, 森田 啓義, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 反辞書は,入力系列に現れない極小系列(極小禁止語)の集まりのことで,これを算術符号の確率モデルとして用いたデータ圧縮法が提案されている.この静的手法では,復号側に送る反辞書コストの削減のために,長さ制限のある極小禁止語の集まりを反辞書として利用し,よい圧縮率を与えることが知られている.しかしながら,反辞書コストを抑えるために,2値アルファベットしか扱えない問題点がある.本稿では,圧縮率の改善を目的として,多値アルファベットを扱える動的な反辞書データ圧縮法を改良し,長さ制限のある極小禁止語の集まりを用いた線形計算量で動作する動的手法を提案する.計算機実験の結果,無記憶およびマルコフ情報源に対してエントロピーレートに近い圧縮率が得られた.また,Calgary corpusのファイルに対しても,従来手法より圧縮率が改善し,平均圧縮率でbzip2と同じ圧縮率が得られた. |
抄録(英) | An antidictionary is the set of all minimal strings, called Minimal Forbidden Words (MFWs), which never appear in an input string, and adaptive arithmetic codings using a statistical model based on antidictionaries have been proposed. In this article, we propose an algorithm using a set of restricted length of MFWs instead of the antidictionary. The proposed algorithm works with on-line manner in linear time. Experimental results show that the proposed algorithm gives better compression ratios on Calgary corpus than traditional algorithms and the same compression ratio on average as a popular compression application bzip2 does. |
キーワード(和) | 反辞書 / 極小禁止語 / データ圧縮 / 接尾辞木 / 線形計算量 |
キーワード(英) | Antidictionary / Minimal Forbidden Word / Data Compression / Suffix Tree / Linear Complexity |
資料番号 | IT2008-99,ISEC2008-157,WBS2008-112 |
発行日 |
研究会情報 | |
研究会 | WBS |
---|---|
開催期間 | 2009/3/2(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Wideband System(WBS) |
---|---|
本文の言語 | JPN |
タイトル(和) | 長さ制限のある極小禁止語を用いた動的な反辞書データ圧縮法(情報通信基礎サブソサイエティ合同研究会) |
サブタイトル(和) | |
タイトル(英) | Adaptive Antidictionary Data Compression Using a Set of Restricted Length of Minimal Forbidden Words |
サブタイトル(和) | |
キーワード(1)(和/英) | 反辞書 / Antidictionary |
キーワード(2)(和/英) | 極小禁止語 / Minimal Forbidden Word |
キーワード(3)(和/英) | データ圧縮 / Data Compression |
キーワード(4)(和/英) | 接尾辞木 / Suffix Tree |
キーワード(5)(和/英) | 線形計算量 / Linear Complexity |
第 1 著者 氏名(和/英) | 太田 隆博 / Takahiro OTA |
第 1 著者 所属(和/英) | 長野県工科短期大学校電子技術科 Department of Electronic Engineering, Nagano Prefectural Institute of Technology |
第 2 著者 氏名(和/英) | 森田 啓義 / Hiroyoshi MORITA |
第 2 著者 所属(和/英) | 電気通信大学大学院情報システム学研究科 Graduate School of Information Systems, University of Electro-Communications |
発表年月日 | 2009-03-10 |
資料番号 | IT2008-99,ISEC2008-157,WBS2008-112 |
巻番号(vol) | vol.108 |
号番号(no) | 474 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |