講演名 | 2010-10-23 グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情) 竹内 孔一, 高橋 秀幸, 小林 大介, |
---|---|
PDFダウンロードページ | ![]() |
抄録(和) | 本研究ではクラスタリングを利用して動詞の類義語を獲得する方法について検討している.先行研究において,同時に2つの要素のクラスタを考慮しながらクラスタリングする同時共起クラスタリングを適用して,ベクトルベースのクラスタリングより精度が高いことを示した.しかし,近年ベクトルベースのクラスタリングでKernel K-meansという非線形境界でクラスタリングするより高度な手法が提案された.そこで,本報告ではKernel K-means法を我々の動詞類語獲得に適用し,先行研究における同じデータで同時共起クラスタリングとの比較を行う.この結果からKernel K-meansでのグラフ-ベクトルの等価性には限界があり,本研究が利用する2部グラフの構造は直接反映できないこと,先行研究の同時共起クラスタリングの方が高い精度で類語を獲得できることを報告する. |
抄録(英) | This manuscript describes evaluation results of Kernel K-means clustering approach comparing with modified Aizawa's co-clustering approach for verb synonym extraction task. Kernel K-means approach is one of the state-of-the-art vector-based clustering method which can divide vector-spaces with non-linear boundary by incorporating Kernel method. Besides the mathematical framework of Kernel K-means can cover Spectral Graph Clustering. In this manuscript, however, we reveal Aizawa's co-clustering approach overcomes Kernel K-means on the verb synonym extraction task (bi-graph clustering) in Japanese. From this results we discuss that the equivalence between graph-vector space in Kernel K-means approach can be limited, and then Kernel K-means decease their accuracy in our verb synonym extraction. |
キーワード(和) | 動詞類語 / 同時共起クラスタリング / Kernel K-means |
キーワード(英) | Verb synonyms / Co-clustering / Kernel K-means Clustering |
資料番号 | TL2010-32,NLC2010-11 |
発行日 |
研究会情報 | |
研究会 | TL |
---|---|
開催期間 | 2010/10/16(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Thought and Language (TL) |
---|---|
本文の言語 | JPN |
タイトル(和) | グラフに基づくクラスタリングによる動詞類義語の獲得(自然言語の論理と感情) |
サブタイトル(和) | |
タイトル(英) | Extraction of Verb Synonyms Using Graph-Based Clustering |
サブタイトル(和) | |
キーワード(1)(和/英) | 動詞類語 / Verb synonyms |
キーワード(2)(和/英) | 同時共起クラスタリング / Co-clustering |
キーワード(3)(和/英) | Kernel K-means / Kernel K-means Clustering |
第 1 著者 氏名(和/英) | 竹内 孔一 / Koichi TAKEUCHI |
第 1 著者 所属(和/英) | 岡山大学大学院自然科学研究科 Graduate School of Natural Science, Okayama University |
第 2 著者 氏名(和/英) | 高橋 秀幸 / Hideyuki TAKAHASHI |
第 2 著者 所属(和/英) | 岡山大学大学院自然科学研究科 Graduate School of Natural Science, Okayama University |
第 3 著者 氏名(和/英) | 小林 大介 / Daisuke KOBAYASHI |
第 3 著者 所属(和/英) | 岡山大学工学部情報工学科 Department of Information Technology, Faculty of Engineering, Okayama University |
発表年月日 | 2010-10-23 |
資料番号 | TL2010-32,NLC2010-11 |
巻番号(vol) | vol.110 |
号番号(no) | 244 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |