講演名 1997/10/17
大規模Bigram-netの空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization
高橋 裕信, 新田 義貴, 遠藤 隆, 岡 隆一,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる.
抄録(英)
キーワード(和)
キーワード(英)
資料番号 NLC97-34
発行日

研究会情報
研究会 NLC
開催期間 1997/10/17(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Natural Language Understanding and Models of Communication (NLC)
本文の言語 JPN
タイトル(和) 大規模Bigram-netの空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization
サブタイトル(和)
タイトル(英) Clustering Method of Large-Scale Bigram-Network Specialization and Application to Text Retrieval
サブタイトル(和)
キーワード(1)(和/英)
第 1 著者 氏名(和/英) 高橋 裕信 / Hironobu TAKAHASHI
第 1 著者 所属(和/英) 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室
Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory
第 2 著者 氏名(和/英) 新田 義貴 / Yoshitaka Nitta
第 2 著者 所属(和/英) 筑波大学
Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory
第 3 著者 氏名(和/英) 遠藤 隆 / Takashi ENDOH
第 3 著者 所属(和/英) 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室
Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory
第 4 著者 氏名(和/英) 岡 隆一 / Ryuichi OKA
第 4 著者 所属(和/英) 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室
Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory
発表年月日 1997/10/17
資料番号 NLC97-34
巻番号(vol) vol.97
号番号(no) 330
ページ範囲 pp.-
ページ数 7
発行日