お知らせ 研究会の開催と会場に参加される皆様へのお願い(2021年10月開催~)
電子情報通信学会 研究会発表申込システム
講演論文 詳細
技報閲覧サービス
[ログイン]
技報アーカイブ
 トップに戻る 前のページに戻る   [Japanese] / [English] 

講演抄録/キーワード
講演名 2008-06-30 17:45
オントロジーを用いた文書間類似度計算手法
溝口祐美子中本利明東芝)・浅川一満東芝情報システム)・長野伸一稲葉真純川村隆浩東芝AI2008-15
抄録 (和) 本稿では, 文書間の意味的な類似性をオントロジーを用いて計算する方法を提案する. 本手法は, 比較対象である2つの文章から抽出されたキーワード郡を比較し類似度を計算する. この時, オントロジーを用いることによって単語が異なる場合においても意味的な距離を考慮して類似度を計算することができる. さらに, 人間が類似度を判定する時, オントロジーの階層の深さや単語の重要度に影響をうける. 本稿で提案した手法は既存の手法に比べ, 人間の類似度判定結果に近い結果を得ることを実験により示す. 
(英) This paper proposes techniques for measuring semantic similarity between documents. We use ontology
to make a machine understand the meaning of a word. Our system measures similarity based on the distance
between a pair of nodes. The words extracted from two documents for comparison are mapped to the nodes. In
this paper, we focused on two processes. The first is a measuring similarity between a pair of nodes in ontology.
The second is a method of aggregating the results of the similarity of each node. Human intuition is influenced
not only by a distance between nodes but also by a structure of the ontology. In the ontology of the domain of
the real world, the depth and width of a node’s descendant are not uniform. Furthermore, a more important word
influences human judgment more strongly. Our approach improved the correlation coefficient between the proposed
approaches and human judgment by considering these human intuitions.
キーワード (和) セマンティック / 類似度 / オントロジー / / / / /  
(英) semantic / similarity / ontology / / / / /  
文献情報 信学技報, vol. 108, no. 119, AI2008-15, pp. 87-92, 2008年6月.
資料番号 AI2008-15 
発行日 2008-06-23 (AI) 
ISSN Print edition: ISSN 0913-5685  Online edition: ISSN 2432-6380
著作権に
ついて
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034)
PDFダウンロード AI2008-15

研究会情報
研究会 AI  
開催期間 2008-06-30 - 2008-06-30 
開催地(和) 関学丸の内キャンパス(東京) 
開催地(英) Kwansei Gakuin University, Tokyo Marunouchi Campus 
テーマ(和) 「Webインテリジェンス」および一般 
テーマ(英)  
講演論文情報の詳細
申込み研究会 AI 
会議コード 2008-06-AI 
本文の言語 日本語 
タイトル(和) オントロジーを用いた文書間類似度計算手法 
サブタイトル(和)  
タイトル(英) Ontology-based Measuring of Similarity between Documents 
サブタイトル(英)  
キーワード(1)(和/英) セマンティック / semantic  
キーワード(2)(和/英) 類似度 / similarity  
キーワード(3)(和/英) オントロジー / ontology  
キーワード(4)(和/英) /  
キーワード(5)(和/英) /  
キーワード(6)(和/英) /  
キーワード(7)(和/英) /  
キーワード(8)(和/英) /  
第1著者 氏名(和/英/ヨミ) 溝口 祐美子 / Yumiko Mizoguchi / ミゾグチ ユミコ
第1著者 所属(和/英) 株式会社 東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA)
第2著者 氏名(和/英/ヨミ) 中本 利明 / Toshiaki Nakamoto / ナカモト トシアキ
第2著者 所属(和/英) 株式会社 東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA)
第3著者 氏名(和/英/ヨミ) 浅川 一満 / Kazuma Asakawa / アサカワ カズマ
第3著者 所属(和/英) 東芝情報システム株式会社 (略称: 東芝情報システム)
TOSHIBA INFORMATION SYSTEMS(JAPAN) CORPORATION (略称: TJ)
第4著者 氏名(和/英/ヨミ) 長野 伸一 / Shinichi Nagano / ナガノ シンイチ
第4著者 所属(和/英) 株式会社 東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA)
第5著者 氏名(和/英/ヨミ) 稲葉 真純 / Masumi Inaba / イナバ マスミ
第5著者 所属(和/英) 株式会社 東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA)
第6著者 氏名(和/英/ヨミ) 川村 隆浩 / Takahiro Kawamura / カワムラ タカヒロ
第6著者 所属(和/英) 株式会社 東芝 (略称: 東芝)
TOSHIBA Corporation (略称: TOSHIBA)
第7著者 氏名(和/英/ヨミ) / /
第7著者 所属(和/英) (略称: )
(略称: )
第8著者 氏名(和/英/ヨミ) / /
第8著者 所属(和/英) (略称: )
(略称: )
第9著者 氏名(和/英/ヨミ) / /
第9著者 所属(和/英) (略称: )
(略称: )
第10著者 氏名(和/英/ヨミ) / /
第10著者 所属(和/英) (略称: )
(略称: )
第11著者 氏名(和/英/ヨミ) / /
第11著者 所属(和/英) (略称: )
(略称: )
第12著者 氏名(和/英/ヨミ) / /
第12著者 所属(和/英) (略称: )
(略称: )
第13著者 氏名(和/英/ヨミ) / /
第13著者 所属(和/英) (略称: )
(略称: )
第14著者 氏名(和/英/ヨミ) / /
第14著者 所属(和/英) (略称: )
(略称: )
第15著者 氏名(和/英/ヨミ) / /
第15著者 所属(和/英) (略称: )
(略称: )
第16著者 氏名(和/英/ヨミ) / /
第16著者 所属(和/英) (略称: )
(略称: )
第17著者 氏名(和/英/ヨミ) / /
第17著者 所属(和/英) (略称: )
(略称: )
第18著者 氏名(和/英/ヨミ) / /
第18著者 所属(和/英) (略称: )
(略称: )
第19著者 氏名(和/英/ヨミ) / /
第19著者 所属(和/英) (略称: )
(略称: )
第20著者 氏名(和/英/ヨミ) / /
第20著者 所属(和/英) (略称: )
(略称: )
講演者
発表日時 2008-06-30 17:45:00 
発表時間 25 
申込先研究会 AI 
資料番号 IEICE-AI2008-15 
巻番号(vol) IEICE-108 
号番号(no) no.119 
ページ範囲 pp.87-92 
ページ数 IEICE-6 
発行日 IEICE-AI-2008-06-23 


[研究会発表申込システムのトップページに戻る]

[電子情報通信学会ホームページ]


IEICE / 電子情報通信学会