講演名 2004/7/7
リサーチマイニング手法におけるクラスタリング閾値設定指針の考察(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
吉田 誠, 小林 隆志, 横田 治夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ネットワーク技術の発達等により、電子的に利用可能な研究論文数が増大してきている.それに伴い,研究者が求めている情報を見つけ出すコストが増大している.このため,目的の情報を探し出すコストを減らす必要がある.本研究の目的は研究の発展経緯等のマクロな情報を抽出し,それらを利用した高度な検索を行うことである.そのための手法として我々はリサーチマイニング手法を提案している.本手法は,論文間の発展経緯の抽出,論文のクラスタリングという2つのフェーズがある.これまで本手法のクラスタリングでは,クラスタリング閾値を変更し,複数回試みることにより定めていたため,適切なクラスタリング閾値を定めるコストが大きく,またクラスタリング結果が研究の発展経緯を理解し易くしているかどうかの根拠が明確ではなかった.そこで本稿では、研究の発展経緯の把握を容易にする論文クラスタを形成するためのクラスタリングの方針を考察する.
抄録(英) By progress of the Internet, the number of research papers that can electronically be derived is increasing. However, the cost of searching them for the required information is still high. Therefore, some functions to reduce the cost is required. Our research goal is to provide an advanced retrieval method for the papers. We have proposed the method research mining. To comprehend macro-flow, There are two phases in research mining. To decided clustering threshold, we had tried applying research mining method many times in different clustering threshold. Therefore it had taken much cost in deciding the threshold. Moreover clustering result was not necessarily what is easier to comprehend the research flow. In this paper, we propose the method to decide the threshold which make grasp of the development circumstances of research easy.
キーワード(和) リサーチマイニング / 論文検索 / データマイニング / クラスタリング / 情報分析
キーワード(英) Research mining / Paper retrieval / Data mining / Clustering / Information analysis
資料番号 DE2004-84
発行日

研究会情報
研究会 DE
開催期間 2004/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) リサーチマイニング手法におけるクラスタリング閾値設定指針の考察(セッション8B : データマイニング)(夏のデータベースワークショップ : DBWS2004)
サブタイトル(和)
タイトル(英) Consideration of the clustering threshold in the Research Mining Method
サブタイトル(和)
キーワード(1)(和/英) リサーチマイニング / Research mining
キーワード(2)(和/英) 論文検索 / Paper retrieval
キーワード(3)(和/英) データマイニング / Data mining
キーワード(4)(和/英) クラスタリング / Clustering
キーワード(5)(和/英) 情報分析 / Information analysis
第 1 著者 氏名(和/英) 吉田 誠 / Makoto YOSHIDA
第 1 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻
Departrnent of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology
第 2 著者 氏名(和/英) 小林 隆志 / Takashi KOBAYASHI
第 2 著者 所属(和/英) 東京工業大学学術国際情報センター
Global Scientific Information & Computing Center, Tokyo Institute of Technology
第 3 著者 氏名(和/英) 横田 治夫 / Haruo YOKOTA
第 3 著者 所属(和/英) 東京工業大学大学院情報理工学研究科計算工学専攻:東京工業大学学術国際情報センター
Departrnent of Computer Science, Graduate School of Information Science and Engineering, Tokyo Institute of Technology:Global Scientific Information & Computing Center, Tokyo Institute of Technology
発表年月日 2004/7/7
資料番号 DE2004-84
巻番号(vol) vol.104
号番号(no) 177
ページ範囲 pp.-
ページ数 6
発行日