講演名 1999/10/25
意味属性を基底とするベクトル空間法の検索精度
木本 泰博, 池原 悟, 村上 仁一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 従来の単語を基底とするベクトル空間法では、通常、多数の単語がベクトルの基底として使用されているため、類似度計算の計算量の多さとベクトルのスパース性が問題となっている。そこで、本論文では単語を意味属性(約2700種)に置き換え、意味属性相互の上下関係を利用して、基底数を圧縮する方法を提案する。BMIR-J2(5080記事)を対象とした検索実験により、検索精度を低下させないためには、最小限意味属性数が約1000∼2000種が必要であること、また、従来の手法との比較実験から基底数が約1000以下の範囲で本手法が有効であること示された。
抄録(英) The conventional Vector Space Model (VSM) uses so many words as the base of semntic vectors to present the meanings of many articles that it uses much time for similarity calculations and sometimes semantic vectors become too to sparse to evalute the similarity. To resolve these problems, this paper proposes a new method to use the semantic attribute system (2,700 attributes), which has recently been proposed, as the base of semntic vectors. In this method, the number of bases can be reduced by using the upper-lower relations among semntic attributes. The experiments were conducted to evaluate the performance of retrieval (precision × recall) for BMIR-J2 resulting as follows:(1) at least 1,000 to 2,000 attributes are necessary to be used not to decrease the performance of the retrieval, (2) when the number of the base is equal or less than 1,000, the proposed method shows high performance compared to the conventional VSM.
キーワード(和) 情報検索 / 意味属性 / ベクトル空間法
キーワード(英) Information retrieval / Semantic attribute / Vector space model
資料番号 NLC99-24
発行日

研究会情報
研究会 NLC
開催期間 1999/10/25(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 意味属性を基底とするベクトル空間法の検索精度
サブタイトル(和)
タイトル(英) Accuracy of vector space model based on semantic attributes
サブタイトル(和)
キーワード(1)(和/英) 情報検索 / Information retrieval
キーワード(2)(和/英) 意味属性 / Semantic attribute
キーワード(3)(和/英) ベクトル空間法 / Vector space model
第 1 著者 氏名(和/英) 木本 泰博 / Yasuhiro Kimoto
第 1 著者 所属(和/英) 鳥取大学工学部
Faculty of Engineering, Tottori University
第 2 著者 氏名(和/英) 池原 悟 / Satoru Ikehara
第 2 著者 所属(和/英) 鳥取大学工学部
Faculty of Engineering, Tottori University
第 3 著者 氏名(和/英) 村上 仁一 / Jinichi Murakami
第 3 著者 所属(和/英) 鳥取大学工学部
Faculty of Engineering, Tottori University
発表年月日 1999/10/25
資料番号 NLC99-24
巻番号(vol) vol.99
号番号(no) 387
ページ範囲 pp.-
ページ数 8
発行日