講演名 2009-05-22
オントロジーを利用した文書間のセマンティックな類似度計算手法(「Webインテリジェンス」及び一般)
溝口 祐美子, 長野 伸一, 稲葉 真純, 川村 隆浩, 大須賀 昭彦,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,文書間の意味的な類似性をオントロジーを用いて計算する方法を提案する.本手法は,比較対象である2つの文章から抽出された単語郡どうしの類似度を概念構造を考慮して類似度を計算する.単語間の意味的な距離はオントロジーを用いることによって抽出する.ここで,人間は単語間の類似度を判定する時,オントロジーの階層の深さなどの構造に影響を受ける.そして,単語群どうしの類似度を判定する時にはキーワード単語の重要度に影響を受ける.そこで,オントロジーの階層の構造に依存する単語間の類似度の変化を反映し,重要度を考慮して集計する文書間の類似度を計算する手法を提案する.本稿で提案した手法は既存の手法に比べ,人間の類似度判定結果に近い結果を得ることを実験により示す.
抄録(英) This paper proposes techniques for measuring semantic similarity between documents. We use ontology to make a machine understand the meaning of a word. Our system measures similarity based on the distance between a pair of nodes. The words extracted from two documents for comparison are mapped to the nodes. In this paper, we focused on two processes. The first is a measuring similarity between a pair of nodes in ontology. The second is a method of aggregating the results of the similarity of each node. Human intuition is influenced not only by a distance between nodes but also by a structure of the ontology. In the ontology of the domain of the real world, the depth and width of a node's descendant are not uniform. Furthermore, a more important word influences human judgment more strongly. Our approach improved the correlation coefficient between the proposed approaches and human judgment by considering these human intuitions.
キーワード(和) セマンティック / 類似度 / オントロジー
キーワード(英) semantic / similarity / ontology
資料番号 AI2009-1
発行日

研究会情報
研究会 AI
開催期間 2009/5/15(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) オントロジーを利用した文書間のセマンティックな類似度計算手法(「Webインテリジェンス」及び一般)
サブタイトル(和)
タイトル(英) Ontology-based Measuring of Semantic Similarity between Documents
サブタイトル(和)
キーワード(1)(和/英) セマンティック / semantic
キーワード(2)(和/英) 類似度 / similarity
キーワード(3)(和/英) オントロジー / ontology
第 1 著者 氏名(和/英) 溝口 祐美子 / Yumiko MIZOGUCHI
第 1 著者 所属(和/英) 株式会社東芝研究開発センター
Corporate Research & Development Center, Toshiba Corp
第 2 著者 氏名(和/英) 長野 伸一 / Shinichi NAGANO
第 2 著者 所属(和/英) 株式会社東芝研究開発センター
Corporate Research & Development Center, Toshiba Corp
第 3 著者 氏名(和/英) 稲葉 真純 / Masumi INABA
第 3 著者 所属(和/英) 株式会社東芝研究開発センター
Corporate Research & Development Center, Toshiba Corp
第 4 著者 氏名(和/英) 川村 隆浩 / Takahiro KAWAMURA
第 4 著者 所属(和/英) 株式会社東芝研究開発センター
Corporate Research & Development Center, Toshiba Corp
第 5 著者 氏名(和/英) 大須賀 昭彦 / Akihiko OHSUGA
第 5 著者 所属(和/英) 電気通信大学
The University of Electro-Communications
発表年月日 2009-05-22
資料番号 AI2009-1
巻番号(vol) vol.109
号番号(no) 51
ページ範囲 pp.-
ページ数 6
発行日