講演名 2005-02-24
木の DP マッチングを利用した DTD 類似度の考察(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
小野里 卓也, 古賀 久志, 渡辺 俊典,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 木構造はXMLや遺伝子情報など多種多様なオブジェクトを表現するのに用いられる。こうした木として表現されたオブジェクトに対して検索や分類を行うには、木の類似度を求める技術が重要である。木の類似度を計算するアルゴリズムとしては木間でDPマッチングを行う手法が知られている。これは、2つの木をノードの挿入、削除、置換によって変換する際の変換コストを類似度とする手法であるが、実際にアプリケーションに適用するには適切なノードの挿入、削除、置換コストを事前にわかっていなければならない。そこで、本研究では木のDPマッチングにおける適切なノードの挿入、削除、置換コストが不明である場合であってもオブジェクトの類似度を定義する手法も提案する。本手法をXMLのスキーマであるDTDの類似性判定に適用し、有用性を確認する。
抄録(英) Tree structure is useful for representing various objects such as XML and gene data. To retrieve and classify objects described as trees, it is important to obtain similarities between trees. Though the tree DP matching algorithm can compute these similarites, one must set proper cost associated with insertion, deletion and replacement of nodes before applying this algorithm to real applications. This paper proposes the method to define similarities, even if proper cost associated with insertion, deletion and replacement of nodes are unknown. This method is proved to be useful by experiments with DTD data, the schema for XML data.
キーワード(和) DPマッチング / 類似度
キーワード(英) DP matching / DTD / Similarity
資料番号 NLC2004-114,PRMU2004-196
発行日

研究会情報
研究会 PRMU
開催期間 2005/2/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Pattern Recognition and Media Understanding (PRMU)
本文の言語 JPN
タイトル(和) 木の DP マッチングを利用した DTD 類似度の考察(学習理論とパターン認識メディア理解, 機械学習による自然言語処理・言語処理を利用したメディア理解, 一般)
サブタイトル(和)
タイトル(英) An Investigation on Similarities between DTD Data Exploiting the Tree DP Matching
サブタイトル(和)
キーワード(1)(和/英) DPマッチング / DP matching
キーワード(2)(和/英) 類似度 / DTD
第 1 著者 氏名(和/英) 小野里 卓也 / Takuya ONOZATO
第 1 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 2 著者 氏名(和/英) 古賀 久志 / Hisashi KOGA
第 2 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 3 著者 氏名(和/英) 渡辺 俊典 / Toshinori WATANABE
第 3 著者 所属(和/英) 電気通信大学大学院情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
発表年月日 2005-02-24
資料番号 NLC2004-114,PRMU2004-196
巻番号(vol) vol.104
号番号(no) 669
ページ範囲 pp.-
ページ数 6
発行日