講演名 | 2005/7/15 アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化) 鈴木 祐介, 松原 茂樹, 吉川 正俊, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | Web上から必要な情報を効率よく得るために, Webページがあらかじめ効果的に整理されていることが望まれる.本論文では, 複数サイトに散在するWebページをディレクトリ構造として階層的に分類する手法を提案する.意味的な上位-下位関係にあるWebページをハイパーリンクを手がかりに特定し, その関係を用いてディレクトリの上位-下位関係を作り上げる.階層構造は, ディレクトリの間で統合を実行することにより構築する.名古屋大学のWebサイトを用いてディレクトリ構造の構築実験を行い, 提案手法の実現可能性を確認した. |
抄録(英) | This paper proposes a method for automatically constructing the hierarchical Web directories from several sites. In order to construct the hierarchical structure of the directories, the method finds the Web pages with the super-sub relations which are connected by the hyperlink, and replaces the relation by the super-sub hierarchical relation between directories. The method constructs the hierarchical directories by iterating the integration of directories. As a result of the experiment using five web sites, the hierarchical directories in which the Web pages on several sites are contained were constructed. |
キーワード(和) | 階層ディレクトリ / クラスタリング / 階層構造 / ハイパーリンク |
キーワード(英) | WWW / hierarchical directory / clustering / hierarchical structure / hyperlink |
資料番号 | NLC2005-12 |
発行日 |
研究会情報 | |
研究会 | NLC |
---|---|
開催期間 | 2005/7/15(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Natural Language Understanding and Models of Communication (NLC) |
---|---|
本文の言語 | JPN |
タイトル(和) | アンカーテキストを用いたWebディレクトリの構築(情報抽出・可視化) |
サブタイトル(和) | |
タイトル(英) | Construction of Web Directory using Anchor Text |
サブタイトル(和) | |
キーワード(1)(和/英) | 階層ディレクトリ / WWW |
キーワード(2)(和/英) | クラスタリング / hierarchical directory |
キーワード(3)(和/英) | 階層構造 / clustering |
キーワード(4)(和/英) | ハイパーリンク / hierarchical structure |
第 1 著者 氏名(和/英) | 鈴木 祐介 / Yusuke SUZUKI |
第 1 著者 所属(和/英) | 名古屋大学大学院情報科学研究科 Graduate School of Information Science, Nagoya University |
第 2 著者 氏名(和/英) | 松原 茂樹 / Shigeki MATSUBARA |
第 2 著者 所属(和/英) | 名古屋大学情報連携基盤センター Information Technology Center, Nagoya University |
第 3 著者 氏名(和/英) | 吉川 正俊 / Masatoshi YOSHIKAWA |
第 3 著者 所属(和/英) | 名古屋大学情報連携基盤センター Information Technology Center, Nagoya University |
発表年月日 | 2005/7/15 |
資料番号 | NLC2005-12 |
巻番号(vol) | vol.105 |
号番号(no) | 203 |
ページ範囲 | pp.- |
ページ数 | 6 |
発行日 |