講演名 2007/7/17
半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集(語彙2)
新納 浩幸, 佐々木 稔,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では語義別用例の収集を目的とした半教師有りクラスタリング手法を提案する。このタスクではクラスタ数(語義数)の推定が重要であり、その点に特化した手法となっている。まず与えられた単語からその語義数(クラスタ数)を大目に見積もる。その見積もったクラスタ数を使って、用例集に対して通常のクラスタリングを行い、細かいクラスタに分割する。次にユーザからの制約を利用して、それらタラスタの統合を行う。本手法は少ない制約数で高い正解率を上げることができる。実験ではSENSEVAL2の日本語辞書タスクで利用された名詞12単語に対するデータを用いて、本手法の有効性を示した。用例間の類似度の測定方法の改良が今後の課題である。
抄録(英) In this paper, we propose a semi-supervised clustering method to collect sentences according to the meaning of a word. In this task, the estimation of the cluster number is most important. Our method concentrates on this problem. First we overestimate the number of meaning (the cluster number) for the target word. By using the number, we conduct the general clustering for data set to get many small clusters. Next using constrains given by the user, we integrate clusters. Our method performs the high precision with small constrains. In the experiment, we try our method for 12 Japanese noun words used in the SENSEVAL2 Japanese dictionary task. The experiment shows the effectiveness of our method. In future, we will improve the measurement of the similarity of sentences.
キーワード(和) 半教師有りクラスタリング / 語義別用例 / 語義数 / 用例間の類似度 / SENSEVAL2日本語辞書タスク
キーワード(英) semi-supervised clustering / example sentences / number of meanings / similarity between sentences / SENSEVAL2 Japanese dictionary task
資料番号 NLC2007-13
発行日

研究会情報
研究会 NLC
開催期間 2007/7/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 半教師有りクラスタリングを用いた語義数の推定と語義別用例の収集(語彙2)
サブタイトル(和)
タイトル(英) Collection of example sentences according to the meaning of a word and estimation of the number of meanings by using semi-supervised clustering
サブタイトル(和)
キーワード(1)(和/英) 半教師有りクラスタリング / semi-supervised clustering
キーワード(2)(和/英) 語義別用例 / example sentences
キーワード(3)(和/英) 語義数 / number of meanings
キーワード(4)(和/英) 用例間の類似度 / similarity between sentences
キーワード(5)(和/英) SENSEVAL2日本語辞書タスク / SENSEVAL2 Japanese dictionary task
第 1 著者 氏名(和/英) 新納 浩幸 / Hiroyuki Shinnou
第 1 著者 所属(和/英) 茨城大学工学部情報工学科
Department of Computer and Information Sciences, Ibaraki University
第 2 著者 氏名(和/英) 佐々木 稔 / Minoru Sasaki
第 2 著者 所属(和/英) 茨城大学工学部情報工学科
Department of Computer and Information Sciences, Ibaraki University
発表年月日 2007/7/17
資料番号 NLC2007-13
巻番号(vol) vol.107
号番号(no) 158
ページ範囲 pp.-
ページ数 6
発行日