講演名 2007-07-02
Webページに対する典型的なクエリの発見(マイニング,夏のデータベースワークショップ2007(データ工学,一般))
甲谷 優, 湯本 高行, 小山 聡, 田中 克己,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 現在,多くのユーザは検索エンジンを用いてWebページを探索し閲覧している.その際の検索式(クエリ)は,Webページ内に潜在的に存在するコンテンツ利用者のニーズを端的に表す要約であると考えられる.したがって,Webページに対する「典型的」なクエリを発見できれば,そのWeb上における位置付けや関連文書,ページ内の利用者ニーズの高い箇所の発見や,さらにはそれを踏まえてのそのページのさらなる内容の充実に役立てられるものと考えられる.本論文では,Webページpに対する典型的なクエリqを,コンテンツ利用者がqで検索してpを閲覧する確率を最も高くするようなものと定義する.本研究では,典型的クエリの候補として実際に使用され得るクエリに限定する.そこで,具体的にどのようなクエリがどのくらいの頻度で実行されているのかという情報を取得するために,検索エンジンのクエリログを利用する.さらに典型的クエリ候補を用いて実際に検索した際にページpを閲覧する確率をqで検索したときのpの順位から推定して利用する方法を提案する.
抄録(英) Nowadays many users use search engines to find and browse a desirable Web page. Those queries to reach a given page concisely describe the needs of users (contents consumers) existing potentially for the page. Therefore, finding "typical queries" for a given Web page will be useful to discover the interests of Web users to the page, and will be moreover, useful for the author to improve its content. In this paper, we define the most "typical query" q for a given page p as the most frequent query by which consumers reach the page p through a Web search engine, and visit the page p. In our research, candidates for the typical query is assumed order to find the "typical queries" for a given Web page, we need actual query frequency information, and so we use queries owned by a search engine. The probability of actually visiting the page p after finding the page p by the query q is calculated from the rank of p in executing q to a Web search engine.
キーワード(和) 典型的クエリ / クエリログ / ランキング
キーワード(英) typical query / query log / ranking
資料番号 DE2007-30
発行日

研究会情報
研究会 DE
開催期間 2007/6/25(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) Webページに対する典型的なクエリの発見(マイニング,夏のデータベースワークショップ2007(データ工学,一般))
サブタイトル(和)
タイトル(英) Discovering Typical Queries for Web Pages
サブタイトル(和)
キーワード(1)(和/英) 典型的クエリ / typical query
キーワード(2)(和/英) クエリログ / query log
キーワード(3)(和/英) ランキング / ranking
第 1 著者 氏名(和/英) 甲谷 優 / Yutaka KABUTOYA
第 1 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 2 著者 氏名(和/英) 湯本 高行 / Takayuki YUMOTO
第 2 著者 所属(和/英) 兵庫県立大学大学院工学研究科
Graduate School of Engineering, University of Hyogo
第 3 著者 氏名(和/英) 小山 聡 / Satoshi OYAMA
第 3 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
第 4 著者 氏名(和/英) 田中 克己 / Katsumi TANAKA
第 4 著者 所属(和/英) 京都大学大学院情報学研究科
Graduate School of Informatics, Kyoto University
発表年月日 2007-07-02
資料番号 DE2007-30
巻番号(vol) vol.107
号番号(no) 131
ページ範囲 pp.-
ページ数 6
発行日