講演名 1998/1/22
HTML文書からの商品情報抽出方式の提案
冨田 一郎, 手塚 祐一, 山本 修一郎, 長岡 満夫,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) WWW上でサービスを行っている仮想商店から商品やサービスを購入するには、現実の買い物と同様、まず商店の場所 (URL) を知る必要がある。しかし、URL検索サービス等を利用して商店の位置を取得しても、希望商品が扱われているか否かを知るには、商店を訪れて商品の有無を検索する必要がある。しかも、商品の検索方法は商店によってまちまちである。このように、希望商品の購入先商店を決定するには、多大な労力と時間が必要となる。我々は、このような商品検索の問題を解決すべく、複数の仮想商店に対して同時に商品検索を行うシステムを構築中である。本稿では、この商品検索システムの概要を述べるとともに、システム内で用いるテンプレートによるHTML文章からの商品情報抽出方式について述べ、テンプレートの自動生成方法について提案する。
抄録(英) When you purchase products or services from a virtual shop on WWW, you need to obtain the URL of the shop at first. But, even if you obtain the shop's URL, you need to search your wishing products in order to know that the shop handles the products. Moreover, Every shop has various method of product search. Thus, it is very hard to obtain the shop that handles your wishing product. In order to solve the above problem, we are constructing the product information retrieval system. This system search products on many virtual shops at the same time. In this paper, we explain a summary of the product information retrieval system and the method of product information extraction from HTML using in this system.
キーワード(和) 情報抽出 / HTML / エレクトロニック・コマース / インターネット
キーワード(英) Information extraction / HTML / Electronic commerce / Internet
資料番号 KBSE97-27
発行日

研究会情報
研究会 KBSE
開催期間 1998/1/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 JPN
タイトル(和) HTML文書からの商品情報抽出方式の提案
サブタイトル(和)
タイトル(英) The Method of Product Information Extraction from HTML Documents
サブタイトル(和)
キーワード(1)(和/英) 情報抽出 / Information extraction
キーワード(2)(和/英) HTML / HTML
キーワード(3)(和/英) エレクトロニック・コマース / Electronic commerce
キーワード(4)(和/英) インターネット / Internet
第 1 著者 氏名(和/英) 冨田 一郎 / Ichiro Tomita
第 1 著者 所属(和/英) NTTソフトウェア研究所
NTT Software Laboratories
第 2 著者 氏名(和/英) 手塚 祐一 / Yuichi Tezuka
第 2 著者 所属(和/英) NTTソフトウェア研究所
NTT Software Laboratories
第 3 著者 氏名(和/英) 山本 修一郎 / Shuichiro Yamamoto
第 3 著者 所属(和/英) NTTマルチメディアシステム総合研究所
NTT Multi-Media System Laboratory Group
第 4 著者 氏名(和/英) 長岡 満夫 / Mitsuo Nagaoka
第 4 著者 所属(和/英) NTTソフトウェア研究所
NTT Software Laboratories
発表年月日 1998/1/22
資料番号 KBSE97-27
巻番号(vol) vol.97
号番号(no) 502
ページ範囲 pp.-
ページ数 8
発行日