講演名 2011-05-26
キーワードの相関性に基づく研究者の特徴抽出(学生,一般)
安藤 志宙, 堀 幸雄, 今井 慈郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 出版される論文数は増加の一途を辿っており,情報の洪水となっている.すなわち,探したい論文をどのようにすれば効率よく見つけることができるかが研究者,特に研究を始めたばかりの若手(初心)研究者にとって大きな課題になっている.そのような数多くの情報から有益な知見をいち早く得るためには,早い段階で個別の研究の特色を見抜くことが重要である.これまで,研究トピックに対応するような文書群を分析する方法として,文書群中に特徴的に現れるキーワードを抽出し,リストアップする方法などが多く利用される傾向にあった.一方,このような方法では,全ての文書で共通に現れるキーワードがリストアップされてしまう傾向にあるとも指摘される.また,効率や性能の上でも,一長一短の状況であり,どれが効率的かという議論や判断が最終的に若手研究者まで行き届いていない状況にあるとも言える.そこで,本報告では,研究者ごとのキーワードの相関性に着目し,個々の研究者ごとの特色を抽出する手法を加えて,いくつかのキーワード抽出法について具体的に適用とその結果を比較検討することで,性能評価を試みた.また,利便性を向上させるため,その抽出結果の可視化にも挑戦した.本稿では,いくつかの研究者で提案手法と既存手法を比較した結果について報告する.
抄録(英) As number of published papers grows more and more rapidly, their readers can hardly recognize or decide which of papers to beselected for their interests by themselves. For the sake of convenient and useful glance at suitably selected papers, it is important for potential readers to grasp meanings of related papers, decide to select them or not, and work out characteristics of research denoted in selected ones in a relatively shorter period. Several researches and studies have taught us some effective methods and solutions to extract and list up characteristic keywords through analysis of papers to be processed. This paper describes selection of conventionally used keyword filtering methods (such as tf-idf, X^2, incidence rate and additionally AIC : Akaike Information Criteria), their real comparison for some specific researchers' papers. It also discusses characteristic analysis for researchers based on correlations between keyword occurrences, visualization of some results, and their performances with concrete descriptions.
キーワード(和) テキストマイニング / キーワード抽出 / AIC
キーワード(英) Text mining / Keyword occurrences / AIC
資料番号 KBSE2011-5
発行日

研究会情報
研究会 KBSE
開催期間 2011/5/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) キーワードの相関性に基づく研究者の特徴抽出(学生,一般)
サブタイトル(和)
タイトル(英) Characteristic Analysis for Researchers based on Correlations between Keyword Occurrences
サブタイトル(和)
キーワード(1)(和/英) テキストマイニング / Text mining
キーワード(2)(和/英) キーワード抽出 / Keyword occurrences
キーワード(3)(和/英) AIC / AIC
第 1 著者 氏名(和/英) 安藤 志宙 / Yukihiro ANDO
第 1 著者 所属(和/英) 香川大学大学院工学研究科
Graduate School of Engineering, Kagawa University
第 2 著者 氏名(和/英) 堀 幸雄 / Yukio HORI
第 2 著者 所属(和/英) 香川大学大学院工学研究科
Graduate School of Engineering, Kagawa University
第 3 著者 氏名(和/英) 今井 慈郎 / Yoshiro IMAI
第 3 著者 所属(和/英) 香川大学大学院工学研究科
Graduate School of Engineering, Kagawa University
発表年月日 2011-05-26
資料番号 KBSE2011-5
巻番号(vol) vol.111
号番号(no) 71
ページ範囲 pp.-
ページ数 6
発行日