講演名 2003/9/8
宿泊施設の公式ホームページ収集システム(<特集>「アクティブマイニング」及び一般)
高木 耕一郎, 山本 雅人, 中津川 雅史, 川村 秀憲, 大内 東,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) WWWの急速な発達により、WWW上での情報検索はますます困難となってきている。特にあるカテゴリーに属するウェブページを発見することは難しい。例えば旅行者が訪れようとしている地域の宿泊施設の公式ホームページを見つけることは困難である。そのような目的は既存の検索エンジンに適さない。なぜならば既存の検索エンジンはキーワードを用いており、宿泊施設の公式ホームページは共通のキーワードを含まないからである。本稿で我々は宿泊施設の公式ホームページを収集するシステムを提案する。それは任意の地域を対象とし、さらに公式ホームページであるか否かも判断することができる。我々は北海道のいくつかの地域に本システムを適用した。また、ルールを変更し他の対象に対するシステムを作成することもできる。これは動的インターネットディレクトリ作成の第一歩である。
抄録(英) It is becoming increasingly difficult to find desired information from the World Wide Web (WWW) due to its rapid growth, and especially, to find web pages belonging to a certain category. For example, it is difficult for tourists to search for official accommodation websites such as hotels and pensions in the area that they will visit. Existing search engines are not suitable for this purpose because these search engines utilize some keywords to extract the information, and accommodation websites do not always contain the most common words. In this paper, we develop an automatic collection system that can extract some accommodation websites in a certain region and detect whether a website is an official one. Our main idea is the utilization of telephone numbers and link-structure analysis. We have applied our proposed system to Hokkaido local accommodation websites in some areas, although the proposed system can also be applied to other objects by changing the extraction rule. This is the first step of our trial to make a dynamic Internet Directory.
キーワード(和) WWW / 宿泊施設の公式ホームページ / 動的インターネットディレクトリ
キーワード(英) WWW / official accommodation websites / ynamic Internet Directory
資料番号 AI2003-48
発行日

研究会情報
研究会 AI
開催期間 2003/9/8(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 ENG
タイトル(和) 宿泊施設の公式ホームページ収集システム(<特集>「アクティブマイニング」及び一般)
サブタイトル(和)
タイトル(英) An Automatic Collection System for Official Accommodation Websites
サブタイトル(和)
キーワード(1)(和/英) WWW / WWW
キーワード(2)(和/英) 宿泊施設の公式ホームページ / official accommodation websites
キーワード(3)(和/英) 動的インターネットディレクトリ / ynamic Internet Directory
第 1 著者 氏名(和/英) 高木 耕一郎 / Kohichiro TAKAGI
第 1 著者 所属(和/英) 北海道大学大学院工学研究科
Graduate School of Engineering, Hokkaido University
第 2 著者 氏名(和/英) 山本 雅人 / Masahito YAMAMOTO
第 2 著者 所属(和/英) 北海道大学大学院工学研究科
Graduate School of Engineering, Hokkaido University
第 3 著者 氏名(和/英) 中津川 雅史 / Masashi NAKATSUGAWA
第 3 著者 所属(和/英) 科学技術振興事業団
Japan Science and Technology Corporation
第 4 著者 氏名(和/英) 川村 秀憲 / Hidenori KAWAMURA
第 4 著者 所属(和/英) 北海道大学大学院工学研究科
Graduate School of Engineering, Hokkaido University
第 5 著者 氏名(和/英) 大内 東 / Azuma OHUCHI
第 5 著者 所属(和/英) 北海道大学大学院工学研究科
Graduate School of Engineering, Hokkaido University
発表年月日 2003/9/8
資料番号 AI2003-48
巻番号(vol) vol.103
号番号(no) 305
ページ範囲 pp.-
ページ数 6
発行日