講演名 2000/5/19
参照情報を利用した文書特徴量抽出方式
野口 進祐, 木下 哲男, 白鳥 則郎,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では, 文書にあらかじめ付与されている他文書への参照情報を利用することで文書ベクトルを拡張する手法を提案し, 文書分類・検索の精度改善を試みる.提案手法では参照情報を利用して意味的にまとまりのある文書の集合を形成し, その解析を行うことでベクトルを構成する単語の重みを修正する.提案手法の評価実験として, 学術論文を利用した文書分類実験と, HTML文章を利用した文書検索実験を行い, 既存手法と比較して分類精度・検索精度ともに改善されることを確認した.
抄録(英) In this paper, we propose a method to expand the document bectors based on reference information and improve the accuracy of document retreival and classification. This method analyzes the document sets which consist of reference information and modifies the term weight. Through the experiment of both the classification of scientific papers and the retrieval of HTML documents, we confirm that the performance of the classification and retrieval can be improved by the proposed method comparing with the existing method.
キーワード(和)
キーワード(英)
資料番号 KBSE2000-18
発行日

研究会情報
研究会 KBSE
開催期間 2000/5/19(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) 参照情報を利用した文書特徴量抽出方式
サブタイトル(和)
タイトル(英) A Method to Extract Features Based on Reference Information
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 野口 進祐 / Shinsuke Noguchi
第 1 著者 所属(和/英) 東北大学電気通信研究所/情報科学研究科
Research Institute of Electrical Communication/Graduate School of Information Sciences, Tohoku University
第 2 著者 氏名(和/英) 木下 哲男 / Tetsuo Kinoshita
第 2 著者 所属(和/英) 東北大学電気通信研究所/情報科学研究科
Research Institute of Electrical Communication/Graduate School of Information Sciences, Tohoku University
第 3 著者 氏名(和/英) 白鳥 則郎 / Norio Shiratori
第 3 著者 所属(和/英) 東北大学電気通信研究所/情報科学研究科
Research Institute of Electrical Communication/Graduate School of Information Sciences, Tohoku University
発表年月日 2000/5/19
資料番号 KBSE2000-18
巻番号(vol) vol.100
号番号(no) 91
ページ範囲 pp.-
ページ数 6
発行日