大会名称 |
---|
2017年 情報科学技術フォーラム(FIT) |
大会コ-ド |
F |
開催年 |
2017 |
発行日 |
2017-09-05 |
セッション番号 |
3C |
セッション名 |
テキスト処理 |
講演日 |
2017/09/12 |
講演場所(会議室等) |
2号館2階 223号講義室 |
講演番号 |
D-005 |
タイトル |
学術情報データベースにおける質的データのクラスター形成手法 |
著者名 |
菊池 桂, 升井洋志, |
キーワード |
データベース, クラスタリング, 質的データ, 学術情報データベース |
抄録 |
大規模なデータにおけるデータ解析およびデータ可視化の一手法として、クラスタリングがある。 一般的に対象データ間の相対距離が多次元空間でのユークリッド距離として定義できる場合は、クラスタリングは多次元の分布の偏りとして表現可能である。しかし、学術情報データにおける著者や所属機関といった質的データについては、ユークリッド距離を一意に定義できないためにクラスタリングが困難となる。本稿では、学術論文間の関連性の把握と今後の研究動向を推測することを目的に、質的データを多く含む学術論文において、著者や著者の所属機関といった書誌情報から学術論文間の相対的距離を算出し、クラスタリングを行う手法を提案する。 |
本文pdf |
PDF download (417.6KB) |