講演名 2011-06-07
Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
足立 貴行, 内山 俊郎, 藤村 考,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) Web検索ログは検索を行うユーザの関心事が反映された情報源であり,そこから人々の関心事が掴めれば,例えば,それをマーケティング調査等に用いることができる.このログに現れる検索語の種類は膨大で把握が困難なため,本稿では検索語をクラスタリングし,各クラスタによって関心事の把握を行う.クエリ内で一緒に用いられる検索語は関連性を持つ.ある検索語は,様々な話題で用いられ,話題毎に異なる検索語と関連性を持つ.従って,ある話題に関する関心事を取り出すためには,話題に限定した関連性のみに着目しないと,適切な関心事抽出ができない.本稿では,ある話題に関連する検索語に対象を限定することでこの問題を解決する方法を示す.また,実際のデータを提案法に適用して手法の有効性を確認し,その活用例を示す.
抄録(英) This paper presents a method to extract users' interests about a topic from query logs, which reflect users' interests. Users' interests are useful for market research. Since there are a number of queries, it is difficult to understand them. In this paper, we use clustering technique and obtain interests characterized by queries in cluster. The words in a query are related to each other. Some query words which appear in various topics are related to different query words in each topic. In order to extract properly users' interests about a topic, we need to focus on the relation of it. Therefore, we propose the way to solve the problem by limiting clustering target. We demonstrate the effectiveness of our method through experiment, and also show some applications using our method.
キーワード(和) Web検索ログ / 関心事 / クラスタリング
キーワード(英) query logs / interests / clustering
資料番号 DE2011-17,PRMU2011-48
発行日

研究会情報
研究会 DE
開催期間 2011/5/30(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) Web検索ログを用いた特定の話題における関心事分析(テーマセッション,大規模マルチメディアデータを対象とした次世代検索およびマイニング)
サブタイトル(和)
タイトル(英) Analysis of Interests in a Topic using Query Logs
サブタイトル(和)
キーワード(1)(和/英) Web検索ログ / query logs
キーワード(2)(和/英) 関心事 / interests
キーワード(3)(和/英) クラスタリング / clustering
第 1 著者 氏名(和/英) 足立 貴行 / Takayuki ADACHI
第 1 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所
NTT Cyber Solutions Laboratories, NTT Corporation
第 2 著者 氏名(和/英) 内山 俊郎 / Toshio UCHIYAMA
第 2 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所
NTT Cyber Solutions Laboratories, NTT Corporation
第 3 著者 氏名(和/英) 藤村 考 / Ko FUJIMURA
第 3 著者 所属(和/英) 日本電信電話株式会社NTTサイバーソリューション研究所
NTT Cyber Solutions Laboratories, NTT Corporation
発表年月日 2011-06-07
資料番号 DE2011-17,PRMU2011-48
巻番号(vol) vol.111
号番号(no) 76
ページ範囲 pp.-
ページ数 6
発行日