講演名 2001/8/23
Extracting Information from the Web
,
PDFダウンロードページ PDFダウンロードページへ
抄録(和)
抄録(英) A wealth of information is available in Internet, how to get the desired information from Web page quickly, precisely and automatically is a job of information extraction(IE) system. RegTab can extract information from tabular Web pages and SemiTxt can extract information from semi-structured HTML text. Both of them use Machine Learning method to generate extraction rules, which is a bottleneck in IE system.
キーワード(和)
キーワード(英) information extraction / machine learning / semi-structured text
資料番号 KBSE2001-5
発行日

研究会情報
研究会 KBSE
開催期間 2001/8/23(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Knowledge-Based Software Engineering (KBSE)
本文の言語 ENG
タイトル(和)
サブタイトル(和)
タイトル(英) Extracting Information from the Web
サブタイトル(和)
キーワード(1)(和/英) / information extraction
第 1 著者 氏名(和/英) / Junqing Zhang
第 1 著者 所属(和/英)
School of Computer Science Beijing Polytechnic University
発表年月日 2001/8/23
資料番号 KBSE2001-5
巻番号(vol) vol.101
号番号(no) 268
ページ範囲 pp.-
ページ数 8
発行日