講演抄録/キーワード |
講演名 |
2011-08-03 10:00
研究履歴生成のための論文メタデータを用いたマージン最大化クラスタリング ○グエン マン クーン・橋本泰一・横田治夫(東工大) DE2011-34 |
抄録 |
(和) |
本研究の目的は,インターネットに公開された論文情報から研究者の研究履歴を自動的に生成することである.既存の研究では、関連する論文集合を発見するために,論文のメタ情報の類似性に注目するk平均法クラスタリングを利用していた.しかし,クラスタリングの精度が低いことが問題であった.本研究では、マージン最大化クラスタリング用いて論文をクラスタリングする手法を提案する.マージン最大化クラスタリングは,クラスタリングアルゴリズムとして比較的精度が高いことが近年の研究で報告されている.しかし,学習をはじめる際の分離超平面の初期値の設定が非常に難しいことがわかった.本研究は,クラスタリングに研究者履歴生成の適用におけるメタ情報の利用方法とマージン最大化クラスタリングの初期値の自動化について述べる.評価実験により,純度が0.67,エントロピーが0.35という結果を得た.従来のk平均法(純度0.35,エントロピー0.47)より提案手法が高精度であることが確認できた. |
(英) |
Our research aim is an automatic generation of a researcher's research history from research articles published on the internet. The research history generation based on k-Means clustering algorithm is proposed in a previous work. However the performance of k-Means algorithm is dissatisfied with it. We propose a method based on Maximum Margin Clustering(MMC). MMC is a new clustering algorithm based on Support Vector Machine(SVM). It is known that MMC is better than existing clustering algorithm, such as k-Means. In this paper, we describe how to convert articles into vectors by meta information of them and decide initial setting of MMC automatically. We illustrate that purity of a method based on MMC is about 0.67 and entropy is about 0.35 in our experimentations. The results is better than one of previous work (purity: 0.35, entropy: 0.47). |
キーワード |
(和) |
リサーチマイニング / クラスタリング / マージン最大化クラスタリング / / / / / |
(英) |
Research mining / Clustering / Maximum Margin Clustering / / / / / |
文献情報 |
信学技報, vol. 111, no. 173, DE2011-34, pp. 41-46, 2011年8月. |
資料番号 |
DE2011-34 |
発行日 |
2011-07-26 (DE) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
DE2011-34 |
研究会情報 |
研究会 |
DE |
開催期間 |
2011-08-02 - 2011-08-03 |
開催地(和) |
立命館大学 (朱雀キャンパス) |
開催地(英) |
Ritusmei University, Suzaki Campus |
テーマ(和) |
アーバンセンシングによる情報創出とその応用、および一般 |
テーマ(英) |
Information Creation and Applications by Urban Sensing, etc |
講演論文情報の詳細 |
申込み研究会 |
DE |
会議コード |
2011-08-DE |
本文の言語 |
日本語 |
タイトル(和) |
研究履歴生成のための論文メタデータを用いたマージン最大化クラスタリング |
サブタイトル(和) |
|
タイトル(英) |
Maximum Margin Clustering of Research Papers Based on Meta Information to Generate Research History |
サブタイトル(英) |
|
キーワード(1)(和/英) |
リサーチマイニング / Research mining |
キーワード(2)(和/英) |
クラスタリング / Clustering |
キーワード(3)(和/英) |
マージン最大化クラスタリング / Maximum Margin Clustering |
キーワード(4)(和/英) |
/ |
キーワード(5)(和/英) |
/ |
キーワード(6)(和/英) |
/ |
キーワード(7)(和/英) |
/ |
キーワード(8)(和/英) |
/ |
第1著者 氏名(和/英/ヨミ) |
グエン マン クーン / Nguyen Manh Cuong / |
第1著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute od Technology (略称: Tokyo Tech Univ.) |
第2著者 氏名(和/英/ヨミ) |
橋本 泰一 / Taiichi Hashimoto / |
第2著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute od Technology (略称: Tokyo Tech Univ.) |
第3著者 氏名(和/英/ヨミ) |
横田 治夫 / Haruo Yokota / |
第3著者 所属(和/英) |
東京工業大学 (略称: 東工大)
Tokyo Institute od Technology (略称: Tokyo Tech Univ.) |
第4著者 氏名(和/英/ヨミ) |
/ / |
第4著者 所属(和/英) |
(略称: )
(略称: ) |
第5著者 氏名(和/英/ヨミ) |
/ / |
第5著者 所属(和/英) |
(略称: )
(略称: ) |
第6著者 氏名(和/英/ヨミ) |
/ / |
第6著者 所属(和/英) |
(略称: )
(略称: ) |
第7著者 氏名(和/英/ヨミ) |
/ / |
第7著者 所属(和/英) |
(略称: )
(略称: ) |
第8著者 氏名(和/英/ヨミ) |
/ / |
第8著者 所属(和/英) |
(略称: )
(略称: ) |
第9著者 氏名(和/英/ヨミ) |
/ / |
第9著者 所属(和/英) |
(略称: )
(略称: ) |
第10著者 氏名(和/英/ヨミ) |
/ / |
第10著者 所属(和/英) |
(略称: )
(略称: ) |
第11著者 氏名(和/英/ヨミ) |
/ / |
第11著者 所属(和/英) |
(略称: )
(略称: ) |
第12著者 氏名(和/英/ヨミ) |
/ / |
第12著者 所属(和/英) |
(略称: )
(略称: ) |
第13著者 氏名(和/英/ヨミ) |
/ / |
第13著者 所属(和/英) |
(略称: )
(略称: ) |
第14著者 氏名(和/英/ヨミ) |
/ / |
第14著者 所属(和/英) |
(略称: )
(略称: ) |
第15著者 氏名(和/英/ヨミ) |
/ / |
第15著者 所属(和/英) |
(略称: )
(略称: ) |
第16著者 氏名(和/英/ヨミ) |
/ / |
第16著者 所属(和/英) |
(略称: )
(略称: ) |
第17著者 氏名(和/英/ヨミ) |
/ / |
第17著者 所属(和/英) |
(略称: )
(略称: ) |
第18著者 氏名(和/英/ヨミ) |
/ / |
第18著者 所属(和/英) |
(略称: )
(略称: ) |
第19著者 氏名(和/英/ヨミ) |
/ / |
第19著者 所属(和/英) |
(略称: )
(略称: ) |
第20著者 氏名(和/英/ヨミ) |
/ / |
第20著者 所属(和/英) |
(略称: )
(略称: ) |
講演者 |
第1著者 |
発表日時 |
2011-08-03 10:00:00 |
発表時間 |
30分 |
申込先研究会 |
DE |
資料番号 |
DE2011-34 |
巻番号(vol) |
vol.111 |
号番号(no) |
no.173 |
ページ範囲 |
pp.41-46 |
ページ数 |
6 |
発行日 |
2011-07-26 (DE) |