講演名 1995/7/21
意味空間のスケール変換による動的シソーラスの実現
小嶋 秀樹, 伊藤 昭,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本論文では,与えられた単語集合Cから文脈(連想方向)を抽出し,それにもとづいて英単語ω,ω'間の距離d(ω,ω')を計算する手法を提案する.本手法では,「意味空間のスケール変換」によって,文脈の抽出とそれにもとづく距離計算を行なう.意味空間の中では,語彙Vの各単語ωがQベクトルとよばれるm次元ベクトルで意味表現される.このQベクトルは,英語辞書にもとづいて生成した2,851次元のPベクトルを主成分分析することによって得られる.本手法によって,与えられた文脈Cに動的に適応した意味空間が得られ,文脈依存的な単語間の距離を計算することができた.先行テキストを文脈とした後続単語の予測をとおして本手法を評価し,与えられた文脈をよく捉えていることを確認した.
抄録(英) This paper proposes a computationally feasible method for measuring context-sensitive semantic distance between words. The distance is computed by adaptive scaling of the semantic space where each word in the vocabulary V is represented by a multi-dimensional Q-vector. The vectors are obtained through a principal component analysis on the P-vectors generated from an English dictionary. Given a word set C which specified a context, each dimension of the semantic space is scaled up or down according to the distribution of C on the dimension. In the scaled space, word distance becomes sensitive to the context which comes out from C. An evaluation through word prediction shows that the proposed distance works well as an context-sensitive word distance.
キーワード(和) 意味距離 / 単語類似度 / 連想 / シソーラス / 文脈処理
キーワード(英) semantic distance / word similarity / association / thesauri / context processing
資料番号
発行日

研究会情報
研究会 NLC
開催期間 1995/7/21(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 意味空間のスケール変換による動的シソーラスの実現
サブタイトル(和)
タイトル(英) Adaptive Scaling of a Semantic Space
サブタイトル(和)
キーワード(1)(和/英) 意味距離 / semantic distance
キーワード(2)(和/英) 単語類似度 / word similarity
キーワード(3)(和/英) 連想 / association
キーワード(4)(和/英) シソーラス / thesauri
キーワード(5)(和/英) 文脈処理 / context processing
第 1 著者 氏名(和/英) 小嶋 秀樹 / Hideki Kozima
第 1 著者 所属(和/英) 郵政省通信総合研究所関西先端研究センター
Kansai Advanced Research Center Communications Research Laboratory
第 2 著者 氏名(和/英) 伊藤 昭 / Akira Ito
第 2 著者 所属(和/英) 郵政省通信総合研究所関西先端研究センター
Kansai Advanced Research Center Communications Research Laboratory
発表年月日 1995/7/21
資料番号
巻番号(vol) vol.95
号番号(no) 169
ページ範囲 pp.-
ページ数 8
発行日