講演名 | 2001/8/23 Extracting Information from the Web , |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | |
抄録(英) | A wealth of information is available in Internet, how to get the desired information from Web page quickly, precisely and automatically is a job of information extraction(IE) system. RegTab can extract information from tabular Web pages and SemiTxt can extract information from semi-structured HTML text. Both of them use Machine Learning method to generate extraction rules, which is a bottleneck in IE system. |
キーワード(和) | |
キーワード(英) | information extraction / machine learning / semi-structured text |
資料番号 | KBSE2001-5 |
発行日 |
研究会情報 | |
研究会 | KBSE |
---|---|
開催期間 | 2001/8/23(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Knowledge-Based Software Engineering (KBSE) |
---|---|
本文の言語 | ENG |
タイトル(和) | |
サブタイトル(和) | |
タイトル(英) | Extracting Information from the Web |
サブタイトル(和) | |
キーワード(1)(和/英) | / information extraction |
第 1 著者 氏名(和/英) | / Junqing Zhang |
第 1 著者 所属(和/英) | School of Computer Science Beijing Polytechnic University |
発表年月日 | 2001/8/23 |
資料番号 | KBSE2001-5 |
巻番号(vol) | vol.101 |
号番号(no) | 268 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |