講演名 2006-06-15
木編集距離を利用した木データの構造と内容の類似性を反映する分類手法(一般セッション(1),データ工学とメディア理解との融合)
齋藤 裕明, 古賀 久志, 渡辺 俊典, 横山 貴紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 木は半構造データや遺伝子情報など多様なオブジェクト表現に用いることが出来るデータ構造であり、パターン認識や情報検索を行う為には木間の類似度を求める技術が重要である。木間類似度としては、2つの木をノードの挿入、削除、置換によって一致させる際の木編集距離を非類似度とする方法がある。木編集距離は木の構造の類似性と内容(ラベル)の類似性を含む非類似度であるが,木データを分類する際、構造の類似性と内容の類似性のどちらを重視するかはアプリケーションやデータによって真なる。そこで本論文では、木編集距離を内容非類似度と構造非類似度の2つに分離し、適用対象の特徴やユーザーの目的を適切に反映するクラスタリング結果を得る方法を提案する。
抄録(英) Tree is useful for representing various objects such as semi-structured data and gene data. Thus, computing tree similarity is important in the research area of pattern recognition and information retrieval. Tree edit distance is one of the most known dissimilarity measures for trees and defined as the minimum value of the total costs associated with node edit operations (i.e, deletion, insertion and relabeling) incurred in the conversion between two trees. Tree edit distance contains both tree structural dissimilarity and label contents dissimilarity. However, the significance of the two dissimilarity depends on the application and the data. Therefore, in this paper, we propose a new method which can get a clustering result which reflects the characteristics of the target application and the users' purpose properly by splitting the tree edit distance into contents dissimilarity and structural dissimilarity.
キーワード(和) 木編集距離 / 木構造類似度 / 内容的類似度 / クラスタリング / XML
キーワード(英) Tree edit distance / Tree structural similarity / Contents similarity / Clustering / XML
資料番号 DE2006-2,PRMU2006-40
発行日

研究会情報
研究会 DE
開催期間 2006/6/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 木編集距離を利用した木データの構造と内容の類似性を反映する分類手法(一般セッション(1),データ工学とメディア理解との融合)
サブタイトル(和)
タイトル(英) Classification method of tree data reflecting structual similarity and contents similarity
サブタイトル(和)
キーワード(1)(和/英) 木編集距離 / Tree edit distance
キーワード(2)(和/英) 木構造類似度 / Tree structural similarity
キーワード(3)(和/英) 内容的類似度 / Contents similarity
キーワード(4)(和/英) クラスタリング / Clustering
キーワード(5)(和/英) XML / XML
第 1 著者 氏名(和/英) 齋藤 裕明 / Hiroaki SAITO
第 1 著者 所属(和/英) 電気通信大学 大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 2 著者 氏名(和/英) 古賀 久志 / Hisashi KOGA
第 2 著者 所属(和/英) 電気通信大学 大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 3 著者 氏名(和/英) 渡辺 俊典 / Toshinori WATANABE
第 3 著者 所属(和/英) 電気通信大学 大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
第 4 著者 氏名(和/英) 横山 貴紀 / Takanori YOKOYAMA
第 4 著者 所属(和/英) 電気通信大学 大学院 情報システム学研究科
Graduate School of Information Systems, University of Electro-Communications
発表年月日 2006-06-15
資料番号 DE2006-2,PRMU2006-40
巻番号(vol) vol.106
号番号(no) 97
ページ範囲 pp.-
ページ数 6
発行日