講演名 2005-07-14
共著関係に基づくグラフを用いた書誌情報における著者同定手法の提案と評価(データマイニング・学習, 夏のデータベースワークショップ2005)
鈴木 康平, 正田 備也, 高須 淳宏, 安達 淳,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 学術文献データベースの著者名検索においてイニシャル等を使用するため同表記の別人を区別出来ないという問題がある.この問題に対しては従来のテキスト情報のみを用いる方法では十分な結果が出ていない.そこで我々は論文の共著関係に基づく情報を用いる手法を提案する.まず, 論文における著者名をノードとして共著関係があるノードどうしにエッジを張ることによりできる共著グラフを生成する.グラフ理論においてあるノードを取り除くことによってグラフの連結成分が増える時, このノードを切断点と呼ぶ.共著グラフにおいて切断点は複数の著者に対応する可能性が高いと考えられる.そのため, 切断点を取り除いて得たそれぞれの連結成分中にあるノードを基に論文を分類することで, 異なる著者ごとに論文を分類することが出来ると考えられる.本稿ではまた, 提案手法を実際の学術文献データベースに適用してその有効性を評価した結果を報告する.
抄録(英) The author name search on citation literature databases shows a problem when the same name refers to more than one author. To identify individual authors, the method based on only text information can't achieve a good result. Therefore, we proposed a new method that uses the information based on coauthor relationship. We report in this paper a new method for generating a coauthor graph representing author name as nodes and coauthor relationship as edges. When the number of connected components increases by removing a node, this node is called cut vertex in graph theory. We use the following intuition : cut vertices tend to correspond to multiple authors. Therefore, we can classify papers written by the same author, if we classify papers based on nodes in each connected component. The proposed method is applied to citation literature databases to examine the effectiveness.
キーワード(和) 著者識別 / データマイニング / グラフ / 頂点連結度
キーワード(英) Author identification / Data mining / Graph / Vertex connectivity
資料番号 DE2005-81
発行日

研究会情報
研究会 DE
開催期間 2005/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 共著関係に基づくグラフを用いた書誌情報における著者同定手法の提案と評価(データマイニング・学習, 夏のデータベースワークショップ2005)
サブタイトル(和)
タイトル(英) Author Identification for Bibliographic Information using Coauthor Relationship Graph
サブタイトル(和)
キーワード(1)(和/英) 著者識別 / Author identification
キーワード(2)(和/英) データマイニング / Data mining
キーワード(3)(和/英) グラフ / Graph
キーワード(4)(和/英) 頂点連結度 / Vertex connectivity
第 1 著者 氏名(和/英) 鈴木 康平 / Kouhei SUZUKI
第 1 著者 所属(和/英) 東京大学大学院情報理工学系研究科
The University of Tokyo, Graduate School of Information Science and Technology
第 2 著者 氏名(和/英) 正田 備也 / Tomonari MASADA
第 2 著者 所属(和/英) 国立情報学研究所
The National Institute of Informatics
第 3 著者 氏名(和/英) 高須 淳宏 / Atsuhiro TAKASU
第 3 著者 所属(和/英) 国立情報学研究所
The National Institute of Informatics
第 4 著者 氏名(和/英) 安達 淳 / Jun ADACHI
第 4 著者 所属(和/英) 国立情報学研究所
The National Institute of Informatics
発表年月日 2005-07-14
資料番号 DE2005-81
巻番号(vol) vol.105
号番号(no) 172
ページ範囲 pp.-
ページ数 6
発行日