講演抄録/キーワード |
講演名 |
2008-06-30 17:45
オントロジーを用いた文書間類似度計算手法 ○溝口祐美子・中本利明(東芝)・浅川一満(東芝情報システム)・長野伸一・稲葉真純・川村隆浩(東芝) AI2008-15 |
抄録 |
(和) |
本稿では, 文書間の意味的な類似性をオントロジーを用いて計算する方法を提案する. 本手法は, 比較対象である2つの文章から抽出されたキーワード郡を比較し類似度を計算する. この時, オントロジーを用いることによって単語が異なる場合においても意味的な距離を考慮して類似度を計算することができる. さらに, 人間が類似度を判定する時, オントロジーの階層の深さや単語の重要度に影響をうける. 本稿で提案した手法は既存の手法に比べ, 人間の類似度判定結果に近い結果を得ることを実験により示す. |
(英) |
This paper proposes techniques for measuring semantic similarity between documents. We use ontology
to make a machine understand the meaning of a word. Our system measures similarity based on the distance
between a pair of nodes. The words extracted from two documents for comparison are mapped to the nodes. In
this paper, we focused on two processes. The first is a measuring similarity between a pair of nodes in ontology.
The second is a method of aggregating the results of the similarity of each node. Human intuition is influenced
not only by a distance between nodes but also by a structure of the ontology. In the ontology of the domain of
the real world, the depth and width of a node’s descendant are not uniform. Furthermore, a more important word
influences human judgment more strongly. Our approach improved the correlation coefficient between the proposed
approaches and human judgment by considering these human intuitions. |
キーワード |
(和) |
セマンティック / 類似度 / オントロジー / / / / / |
(英) |
semantic / similarity / ontology / / / / / |
文献情報 |
信学技報, vol. 108, no. 119, AI2008-15, pp. 87-92, 2008年6月. |
資料番号 |
AI2008-15 |
発行日 |
2008-06-23 (AI) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
AI2008-15 |