講演名 2003/5/22
完全N部グラフ構造を用いた単語の多義性獲得(<特集>「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論,論理プログラム,プランニングetc.」及び一般)(一般及び自動推論)
中渡瀬 秀一, 相澤 彰子,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文ではテキスコーパスを解析して,この中に含まれる多義性を持つ単語を発見するための方法を提案する.この方法ではまずコーパス中に含まれる単語同士の関係を形態素解析などによって抽出しておき,この関係の集合からN部グラフを構成する.次にこのグラフ中に含まれる極大完全N部グラフを抽出し,ある単語が複数の分類(語義に対応する)に属することを許容するようなクラスタリングを行う.これにより多義性を持つ単語であれば複数のクラスタに含まれるようになるため,その所属するクラスタの数に注目することで多義性を獲得可能になる.この効果を確認するために行った実験では,約30万の用例からグラフを構成し,約3万の単語を対象にクラスタリングを行った結果531の候補を得た.そのうち20語が実際に多義語であった.
抄録(英) This paper presents a method for discovering polysemic words. This method is based on extracting of maximal complete N-partite graphs from a N-partite graph corresponding to relations of words in a corpus. Those relations are obtained by the morphological analysis etc. And the extracted graphs as clusters of words are merged on some conditions. Consequently, a certain word that is polysemous belongs to two or more classifications. We experimented in order to check this clustering eifect. As a result of the this experiment, we obtained the 531 polysemy candidates from the graph which includes 30,000 nodes (words) - 20 words were actually polysemies among those.
キーワード(和) 自然言語 / 意味 / 獲得 / 多義性 / 類義語 / 完全N部グラフ
キーワード(英) natural language / semantics / polysemy / N-partite graph
資料番号 AI2003-2
発行日

研究会情報
研究会 AI
開催期間 2003/5/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) 完全N部グラフ構造を用いた単語の多義性獲得(<特集>「自動推論:帰納,演繹,モデル検査/生成,学習,発見,仮説推論,論理プログラム,プランニングetc.」及び一般)(一般及び自動推論)
サブタイトル(和)
タイトル(英) Word Sense Discrimination based on complete N-partite graph
サブタイトル(和)
キーワード(1)(和/英) 自然言語 / natural language
キーワード(2)(和/英) 意味 / semantics
キーワード(3)(和/英) 獲得 / polysemy
キーワード(4)(和/英) 多義性 / N-partite graph
キーワード(5)(和/英) 類義語
キーワード(6)(和/英) 完全N部グラフ
第 1 著者 氏名(和/英) 中渡瀬 秀一 / Hidekazu NAKAWATASE
第 1 著者 所属(和/英) 総合研究大学院大学
The Graduate University for advanced studies
第 2 著者 氏名(和/英) 相澤 彰子 / Akiko AIZAWA
第 2 著者 所属(和/英) 国立情報学研究所
National Institute of Information
発表年月日 2003/5/22
資料番号 AI2003-2
巻番号(vol) vol.103
号番号(no) 103
ページ範囲 pp.-
ページ数 6
発行日