講演名 2008-06-30
オントロジーを用いた文書間類似度計算手法(「Webインテリジェンス」及び一般)
溝口 祐美子, 中本 利明, 浅川 一満, 長野 伸一, 稲葉 真純, 川村 隆浩,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,文書間の意味的な類似性をオントロジーを用いて計算する方法を提案する.本手法は,比較対象である2つの文章から抽出されたキーワード郡を比較し類似度を計算する.この時,オントロジーを用いることによって単語が異なる場合においても意味的な距離を考慮して類似度を計算することができる.さらに,人間が類似度を判定する時,オントロジーの階層の深さや単語の重要度に影響をうける.本稿で提案した手法は既存の手法に比べ,人間の類似度判定結果に近い結果を得ることを実験により示す.
抄録(英) This paper proposes techniques for measuring semantic similarity between documents. We use ontology to make a machine understand the meaning of a word. Our system measures similarity based on the distance between a pair of nodes. The words extracted from two documents for comparison are mapped to the nodes. In this paper, we focused on two processes. The first is a measuring similarity between a pair of nodes in ontology. The second is a method of aggregating the results of the similarity of each node. Human intuition is influenced not only by a distance between nodes but also by a structure of the ontology. In the ontology of the domain of the real world, the depth and width of a node's descendant are not uniform. Furthermore, a more important word influences human judgment more strongly. Our approach improved the correlation coefficient between the proposed approaches and human judgment by considering these human intuitions.
キーワード(和) セマンティック / 類似度 / オントロジー
キーワード(英) semantic / similarity / ontology
資料番号 AI2008-15
発行日

研究会情報
研究会 AI
開催期間 2008/6/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) オントロジーを用いた文書間類似度計算手法(「Webインテリジェンス」及び一般)
サブタイトル(和)
タイトル(英) Ontology-based Measuring of Semantic Similarity between Documents
サブタイトル(和)
キーワード(1)(和/英) セマンティック / semantic
キーワード(2)(和/英) 類似度 / similarity
キーワード(3)(和/英) オントロジー / ontology
第 1 著者 氏名(和/英) 溝口 祐美子 / Yumiko MIZOGUCHI
第 1 著者 所属(和/英) 株式会社東芝研究開発センター
Faculty of Engineering, Corporate Research & Development Center
第 2 著者 氏名(和/英) 中本 利明 / Toshiaki NAKAMOTO
第 2 著者 所属(和/英) 東芝情報システム株式会社
TOSHIBA INFORMATION SYSTEMS (JAPAN) CORPORATION
第 3 著者 氏名(和/英) 浅川 一満 / Kazuma ASAKAWA
第 3 著者 所属(和/英) 東芝情報システム株式会社
TOSHIBA INFORMATION SYSTEMS (JAPAN) CORPORATION
第 4 著者 氏名(和/英) 長野 伸一 / Shinichi NAGANO
第 4 著者 所属(和/英) 株式会社東芝研究開発センター
Faculty of Engineering, Corporate Research & Development Center
第 5 著者 氏名(和/英) 稲葉 真純 / Masumi INABA
第 5 著者 所属(和/英) 株式会社東芝研究開発センター
Faculty of Engineering, Corporate Research & Development Center
第 6 著者 氏名(和/英) 川村 隆浩 / Takahiro KAWAMURA
第 6 著者 所属(和/英) 株式会社東芝研究開発センター
Faculty of Engineering, Corporate Research & Development Center
発表年月日 2008-06-30
資料番号 AI2008-15
巻番号(vol) vol.108
号番号(no) 119
ページ範囲 pp.-
ページ数 6
発行日