電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
技報オンライン
‥‥ (ESS/通ソ/エレソ/ISS)
技報アーカイブ
‥‥ (エレソ)
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-06-19 15:00
ゼロサプレス型二分決定グラフによる圧縮と知識発見
倉井龍太郎湊 真一ツォイクマン トーマス北大
技報オンラインサービス実施中
抄録 (和) 本研究ではNormalized Compression Distance(NCD)とセロサプレス型BDD(ZBDD)を用いた, テキストの分類手法について提案する. NCDはコルモゴロフ複雑性を利用して定義される文字列同士の距離であるNormalized Information Distanceを近似したものである. NCDは一般的に{\tt gzip, bzip2}といった既存の圧縮ソフトウェアを利用して計算される.
対して本研究ではZBDDの持つアイテム組合せ集合を圧縮して保管する能力を利用してこのNCDを計算する方法を提案した. また,実験によりその能力を評価した. 
(英) In the present paper we propose a new method for clustering text data by using
the Normalized Compression Distance and Zero-Suppressed BDDs. The Normalized
Compression Distance can be considered as an approximation of the Normalized Information Distance which is defined by using Kolmogorov complexity. Standard string compressors such as {\tt gzip, bzip2} have beenpreviously used to compute the Normalized Compression Distance.
In contrast, we propose to use the ZBDD representation of item sets as a compressor for the item sets. We conducted experiments for clustering by using our methods. The results obtained show the usefulness of this approach.
キーワード (和) コルモゴロフ複雑性 / ゼロサプレス型BDD / クラスタリング / テキストマイニング / データ圧縮 / / /  
(英) Kolmogorov complexity / Zero-Suppressed BDD / Clustering / Text mining / Data compression / / /  
文献情報 信学技報, vol. 108, no. 93, DE2008-10, pp. 53-58, 2008年6月.
資料番号 DE2008-10 
発行日 2008-06-12 (DE, PRMU) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380

研究会情報
研究会 PRMU DE  
開催期間 2008-06-19 - 2008-06-20 
開催地(和) 小樽市民会館 
開催地(英) Otaru-Shimin-Kaikan 
テーマ(和) 膨大なデータから学ぶもの 
テーマ(英)  
講演論文情報の詳細
申込み研究会 DE 
会議コード 2008-06-PRMU-DE 
本文の言語 日本語 
タイトル(和) ゼロサプレス型二分決定グラフによる圧縮と知識発見 
サブタイトル(和)  
タイトル(英) Knowledge Discovery and Compression by Using Zero-suppressed BDDs 
サブタイトル(英)  
キーワード(1)(和/英) コルモゴロフ複雑性 / Kolmogorov complexity  
キーワード(2)(和/英) ゼロサプレス型BDD / Zero-Suppressed BDD  
キーワード(3)(和/英) クラスタリング / Clustering  
キーワード(4)(和/英) テキストマイニング / Text mining  
キーワード(5)(和/英) データ圧縮 / Data compression  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 倉井 龍太郎 / Ryutaro Kurai / クライ リュウタロウ
第1著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第2著者 氏名(和/英/ヨミ) 湊 真一 / Shin-ichi Minato / ミナト シンイチ
第2著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第3著者 氏名(和/英/ヨミ) ツォイクマン トーマス / Thomas Zeugmann / ツォイクマン トーマス
第3著者 所属(和/英) 北海道大学 (略称: 北大)
Hokkaido University (略称: Hokkaido Univ.)
第4著者 氏名(和/英/ヨミ) / /
第4著者 所属(和/英) (略称: )
(略称: )
第5著者 氏名(和/英/ヨミ) / /
第5著者 所属(和/英) (略称: )
(略称: )
第6著者 氏名(和/英/ヨミ) / /
第6著者 所属(和/英) (略称: )
(略称: )
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2008-06-19 15:00:00 
発表時間 30 
申込先研究会 DE 
資料番号 IEICE-DE2008-10,IEICE-PRMU2008-28 
巻番号(vol) IEICE-108 
号番号(no) no.93(DE), no.94(PRMU) 
ページ範囲 pp.53-58 
ページ数 IEICE-6 
発行日 IEICE-DE-2008-06-12,IEICE-PRMU-2008-06-12 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会