講演名 2006-07-13
複数Webサイトからの共通属性抽出による共通サイトマップの生成(ウェブ属性抽出)
小谷 彬, 大島 裕明, 小山 聡, 田中 克己,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Webサイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWebサイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWebサイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWebサイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWebサイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.
抄録(英) For getting information of necessity efficiently in a Web site, a Web site has the site map which arranges inforamtions based on the structure and contents of the site. For a user, it is desirable for site maps to be arranged in a similar form between multiple Web sites. Because, it is burden for a user to compare and browse the Web pages describing common subject between multiple similar Web sites. Therefore we propose the technique extracting common attributes between multiple Web sites and finding the Web page falling under each attribute of the common attributes. As a result, we generate the common site map for multiple Web sites. In common attribute extraction, we show the technique to express an attribute by a single word and the technique of attribute expansion to show an attribute in multiple words for hierarchization between attributes and unification of a similar attribute more.
キーワード(和) データマイニング / 情報検索 / Webとインターネット / サイトマップ
キーワード(英) Data Mining / Information Retrieval / Web and Internet / Site Map
資料番号 DE2006-56
発行日

研究会情報
研究会 DE
開催期間 2006/7/6(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) 複数Webサイトからの共通属性抽出による共通サイトマップの生成(ウェブ属性抽出)
サブタイトル(和)
タイトル(英) Generation of Common Site Maps by Extracting Common Attributes from Multiple Web Sites
サブタイトル(和)
キーワード(1)(和/英) データマイニング / Data Mining
キーワード(2)(和/英) 情報検索 / Information Retrieval
キーワード(3)(和/英) Webとインターネット / Web and Internet
キーワード(4)(和/英) サイトマップ / Site Map
第 1 著者 氏名(和/英) 小谷 彬 / Akira KOTANI
第 1 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 大島 裕明 / Hiroaki OHSHIMA
第 2 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
第 3 著者 氏名(和/英) 小山 聡 / Satoshi OYAMA
第 3 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
第 4 著者 氏名(和/英) 田中 克己 / Katsumi TANAKA
第 4 著者 所属(和/英) 京都大学大学院情報学研究科社会情報学専攻
Department of Social Informatics, Graduate School of Informatics, Kyoto University
発表年月日 2006-07-13
資料番号 DE2006-56
巻番号(vol) vol.106
号番号(no) 149
ページ範囲 pp.-
ページ数 6
発行日