講演名 | 2000/9/18 機械学習によるWebページの自動分類 塚田 誠, 鷲尾 隆, 元田 浩, |
---|---|
PDFダウンロードページ | PDFダウンロードページへ |
抄録(和) | この論文では, 機械学習によるWebページの自動分類に関する研究について述べる.WWWにおける検索エンジンを含むポータルサイトのサービスが, 最近ではますます重要になっている.特に, Webページを階層的に複数のカテゴリに分類している, ヤフーのようなポータルサイトが人気がある.しかしながら, 各々のカテゴリへのWebページの分類は一般的に人手によって行われている.この問題を逓減するため, 我々は2つの属性生成方式に基づく, 自動的にWebページを分類する技術を提案する.我々は, 各々のWebページに対する妥当なクラスを決定づける決定木を構築するために, この技術をYahoo! JAPAN上のWebページに適用する.提案した手法の分類精度をエラー率, 再現率, そして適合率によって評価する. |
抄録(英) | This paper discribes automatic Web-page classification by using machine learning methods. Recently, the importance of portal site services including the search engine function on WWW is increasing. Especially, the portal site hierarchically classifying Web-pages into many topics are becoming popular such as Yahoo! service. However, the classification of Web-page into each topic category typically relies on man power, where it costs much time and care. To alleviate this problem, we propose a technique to classify Web-page automatically based on two methods for attribute generation. We apply this technique to Web-pages on Yahoo! JAPAN to construct decision trees which determine appropriate classes for each Web-page. The performance of the proposed method is evaluated in terms of error rate, recall, and precision |
キーワード(和) | Webページ / 分類 / 機械学習 / C4.5 / 決定木 |
キーワード(英) | Web-page / classification / machine learning / C4.5 / decision tree |
資料番号 | AI2000-40 |
発行日 |
研究会情報 | |
研究会 | AI |
---|---|
開催期間 | 2000/9/18(から1日開催) |
開催地(和) | |
開催地(英) | |
テーマ(和) | |
テーマ(英) | |
委員長氏名(和) | |
委員長氏名(英) | |
副委員長氏名(和) | |
副委員長氏名(英) | |
幹事氏名(和) | |
幹事氏名(英) | |
幹事補佐氏名(和) | |
幹事補佐氏名(英) |
講演論文情報詳細 | |
申込み研究会 | Artificial Intelligence and Knowledge-Based Processing (AI) |
---|---|
本文の言語 | JPN |
タイトル(和) | 機械学習によるWebページの自動分類 |
サブタイトル(和) | |
タイトル(英) | Automatic Web-Page Classification by Using Machine Learning Methods |
サブタイトル(和) | |
キーワード(1)(和/英) | Webページ / Web-page |
キーワード(2)(和/英) | 分類 / classification |
キーワード(3)(和/英) | 機械学習 / machine learning |
キーワード(4)(和/英) | C4.5 / C4.5 |
キーワード(5)(和/英) | 決定木 / decision tree |
第 1 著者 氏名(和/英) | 塚田 誠 / Makoto Tsukada |
第 1 著者 所属(和/英) | 大阪大学産業科学研究所 I.S.I.R.Osaka University |
第 2 著者 氏名(和/英) | 鷲尾 隆 / Takashi Washio |
第 2 著者 所属(和/英) | 大阪大学産業科学研究所 I.S.I.R.Osaka University |
第 3 著者 氏名(和/英) | 元田 浩 / Hiroshi Motoda |
第 3 著者 所属(和/英) | 大阪大学産業科学研究所 I.S.I.R.Osaka University |
発表年月日 | 2000/9/18 |
資料番号 | AI2000-40 |
巻番号(vol) | vol.100 |
号番号(no) | 321 |
ページ範囲 | pp.- |
ページ数 | 8 |
発行日 |