大会名称
2017年 情報科学技術フォーラム(FIT)
大会コ-ド
F
開催年
2017
発行日
2017-09-05
セッション番号
3C
セッション名
テキスト処理
講演日
2017/09/12
講演場所(会議室等)
2号館2階 223号講義室
講演番号
D-005
タイトル
学術情報データベースにおける質的データのクラスター形成手法
著者名
菊池 桂升井洋志
キーワード
データベース, クラスタリング, 質的データ, 学術情報データベース
抄録
大規模なデータにおけるデータ解析およびデータ可視化の一手法として、クラスタリングがある。
一般的に対象データ間の相対距離が多次元空間でのユークリッド距離として定義できる場合は、クラスタリングは多次元の分布の偏りとして表現可能である。しかし、学術情報データにおける著者や所属機関といった質的データについては、ユークリッド距離を一意に定義できないためにクラスタリングが困難となる。本稿では、学術論文間の関連性の把握と今後の研究動向を推測することを目的に、質的データを多く含む学術論文において、著者や著者の所属機関といった書誌情報から学術論文間の相対的距離を算出し、クラスタリングを行う手法を提案する。
本文pdf
PDF download (417.6KB)