講演名 2003/7/24
エージェントに基づくウェブページ分類の実験評価(1)(「21世紀の知識情報科学に向けて」,及び一般)
荒谷 寛和, 藤田 茂, 菅原 研次,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,ウェブ検索エンジンの多くに発生するトピックドリフト問題の解決に一つの手法を与える,エージェントに基づくウェブページの分類手法の提案と評価実験について述べる.トピックドリフト問題は,ウェブ検索エンジンの重要性の高まりとともに着目されている課題であり,検索キーワードとは直接関係のないコンテンツを持つウェブページが,検索エンジンのランキングで上位を占める問題を指す.トピックドリフト問題の発生の背景には,個人が作成したいわゆるWeb日記.blogと呼ばれるページの増加や,悪意を持って検索エンジンの利用者を自らのWebサイトに誘導しようとする,いわゆるスパムページの存在が上げられる.この問題は,検索エンジンが特定のアルゴリズムに従ってウェブページの順位付けを行う限りは解決が困難であると考えられる.そこで本稿では,ウェブページの分類と検索順位の決定にウェブページの相互評価を用いる手法を提案した.提案手法を評価するために,実験データ:機械的に生成したウェブページ200個,に対して検索を行ったところ,スパムページの順位が下がり,結果としてトピックドリフト問題を解決できることが示された.
抄録(英) In recent year, crawler-based search engines such as Google have been popular for infomation retreival.However, there is the topic drift problem which is caused by such web pages as the same words with search keywordsor many hyperlinks are described repeatedly. As results of this problem, web pages which dont include useful contentenough for searchers appear in retrieval results at high rank. In this paper, we provide the solution of the topicdrift problem. And we have evaluated our retrieval model in experimental data set.
キーワード(和) ウェブベージ分類 / マルチエージェントシステム / トピックドリフト問題
キーワード(英) Web page classify system / Multi-agent system / Topic drift problem
資料番号 AI2003-18
発行日

研究会情報
研究会 AI
開催期間 2003/7/24(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) エージェントに基づくウェブページ分類の実験評価(1)(「21世紀の知識情報科学に向けて」,及び一般)
サブタイトル(和)
タイトル(英) Agent-based Web Pages Classify Model A Experimental Report Part 1
サブタイトル(和)
キーワード(1)(和/英) ウェブベージ分類 / Web page classify system
キーワード(2)(和/英) マルチエージェントシステム / Multi-agent system
キーワード(3)(和/英) トピックドリフト問題 / Topic drift problem
第 1 著者 氏名(和/英) 荒谷 寛和 / Hirokazu ARATANl
第 1 著者 所属(和/英) 千葉工業大学大学院工学研究科情報工学
Graduate School, Chiba Institute of Technology
第 2 著者 氏名(和/英) 藤田 茂 / Shigeru FUJITA
第 2 著者 所属(和/英) 千葉工業大学情報科学部情報工学科
Department of Computer Science, Faculty of Computer and Infomation Science, Chiba Intitute of Technology
第 3 著者 氏名(和/英) 菅原 研次 / Kenji SUGAWARA
第 3 著者 所属(和/英) 千葉工業大学情報科学部情報ネットワーク学科
Department of Network Science, Faculty of Computer and Infomation Science, Chiba Intitute of Technology
発表年月日 2003/7/24
資料番号 AI2003-18
巻番号(vol) vol.103
号番号(no) 243
ページ範囲 pp.-
ページ数 6
発行日