講演名 | 1997/10/17 大規模Bigram-netの空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization 高橋 裕信, 新田 義貴, 遠藤 隆, 岡 隆一, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | 本報告ではテキストを時系列データと考える大規模なテキストデータベースを対象として, 単語を空間に配置し, 空間の距離を利用した文章の検索方式を提案する. まず, 形態素解析によって分節した単語をノードとして, 単語bigramの作るネットワークを構築する. 次にこのネットワークのノードを有限次元の空間中に, ノード群のクラスタリングを伴なう配置問題を考える. この配置問題は, 時系列方向での近傍共起性から, ノード間の距離を定義し, 有限の小さい次元の空間で効率よく分類 (クラスタリング) するために, 最適化関数を導入した非線形化した手法で解かれている. 本手法を新聞データベースのリアルタイム検索に適用した実験結果について述べる. |
抄録(英) | |
キーワード(和) | |
キーワード(英) | |
資料番号 | NLC97-34 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 1997/10/17(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | 大規模Bigram-netの空間クラスタリングとそのテキスト検索への応用 : Bigram-net Galactic Spatialization |
サブタイトル(和) | |
タイトル(英) | Clustering Method of Large-Scale Bigram-Network Specialization and Application to Text Retrieval |
サブタイトル(和) | |
キーワード(1)(和/英) | |
第 1 著者 氏名(和/英) | 高橋 裕信 / Hironobu TAKAHASHI |
第 1 著者 所属(和/英) | 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室 Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory |
第 2 著者 氏名(和/英) | 新田 義貴 / Yoshitaka Nitta |
第 2 著者 所属(和/英) | 筑波大学 Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory |
第 3 著者 氏名(和/英) | 遠藤 隆 / Takashi ENDOH |
第 3 著者 所属(和/英) | 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室 Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory |
第 4 著者 氏名(和/英) | 岡 隆一 / Ryuichi OKA |
第 4 著者 所属(和/英) | 新情報処理開発機構 つくば研究センター情報ベース機能つくば研究室 Real World Computing Partnership Tsukuba Research Center Information Basis Function Laboratory |
発表年月日 | 1997/10/17 |
資料番号 | NLC97-34 |
巻番号(vol) | vol.97 |
号番号(no) | 330 |
ページ範囲 | pp.- |
ページ数 | 7 |
発行日 |