講演名 2006-05-18
木文法を用いた半構造化文書の圧縮と反単一化(「自動化:推論,発見,学習,データマイニング」及び一般)
小沼 潤, 土井 晃一郎, 山本 章博,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 反単一化は論理において複数の項に共通する構造を抽出する操作であり,半構造化文書などの構造データから共通構造を発見する手法として用いられている.本研究では,半構造化文書の構造を木文法で表現する圧縮アルゴリズムTGCAを提案し,TGCAによって圧縮されたデータに対する反単一化を求める.また,本手法と従来の反単一化手法との比較を行う.
抄録(英) In this study, we present an algorithm named TGCA which compresses semi-structured texts, and performs anti-unification on semi-structured texts compressed by the algorithm. Anti-unification is a method for extracting common structure from several data, and is used in the theory of machine learning based on logic. By the anti-unification of semi-structured texts, we can get the common structure from several texts. We analyze the performance of our model in the best and worst case scenarios, and compare it with the original model.
キーワード(和) 反単一化 / 半構造化文書 / データ圧縮
キーワード(英) anti-unification / semi-structured data / deta compression
資料番号 AI2006-9
発行日

研究会情報
研究会 AI
開催期間 2006/5/11(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 木文法を用いた半構造化文書の圧縮と反単一化(「自動化:推論,発見,学習,データマイニング」及び一般)
サブタイトル(和)
タイトル(英) Data Compression and Anti-unification for Semi-structured Documents with Tree Grammars
サブタイトル(和)
キーワード(1)(和/英) 反単一化 / anti-unification
キーワード(2)(和/英) 半構造化文書 / semi-structured data
キーワード(3)(和/英) データ圧縮 / deta compression
第 1 著者 氏名(和/英) 小沼 潤 / Jun ONUMA
第 1 著者 所属(和/英) 京都大学 工学部:株式会社メイテック
Faculty of Engineering, Kyoto University:MEITEC Corp.
第 2 著者 氏名(和/英) 土井 晃一郎 / Koichiro DOI
第 2 著者 所属(和/英) 京都大学 大学院情報学研究科
Graduated School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 山本 章博 / Akihiro YAMAMOTO
第 3 著者 所属(和/英) 京都大学 大学院情報学研究科
Graduated School of Informatics, Kyoto University
発表年月日 2006-05-18
資料番号 AI2006-9
巻番号(vol) vol.106
号番号(no) 38
ページ範囲 pp.-
ページ数 6
発行日