講演名 2010-06-25
WEB検索高度化のためのアンサンブル学習に基づく訓練事例の精錬(「Webインテリジェンス」及び一般)
平林 宏基, 岩沼 宏治, 山本 泰生, 鍋島 英知,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) WEBの専門検索エンジンを簡便に構築するための手法として,小山らは"検索隠し味"と呼ばれる検索質問へ拡張語を付加する方法を提案している.この検索隠し味を生成するには決定木学習が必要となるが,その決定木学習用の良質な学習データの準備には大きな労力を必要とする.本研究では,バギングと呼ばれるアンサンブル学習法を用いて,決定木の学習のための良質な学習データを自動生成する手法について実証的な考察を行う.検証実験を通して,先行研究よりも安定的に良質な学習用データを生成できる可能性が高いことを示す.
抄録(英) The Keyword Spices, proposed Oyama et al., is a sort of a query-expansion technology, which adds pre-computed additional words to a given query in order to perform an effective domain-specific WEB search. The Keyword Spice technology can achieve a significant performance, but needs a great deal of high-quality training data for learning a decision tree, from which adequate additional words to a query are generated. In this paper, we study an ensemble learning method, especially so-called a bagging, for decision trees used to refine noisy training data for synthesizing good keyword spice words. Throughout experimental evaluations, we show that a bagging method has a high possibility for stabilizing the effects for refining noisy data.
キーワード(和) WEB検索 / 検索隠し味 / アンサンブル学習 / 決定木 / 専門検索
キーワード(英) WEB search / keyword spice / ensemble learning / decision tree / domain-specific search / refinement
資料番号 AI2010-5
発行日

研究会情報
研究会 AI
開催期間 2010/6/18(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Artificial Intelligence and Knowledge-Based Processing (AI)
本文の言語 JPN
タイトル(和) WEB検索高度化のためのアンサンブル学習に基づく訓練事例の精錬(「Webインテリジェンス」及び一般)
サブタイトル(和)
タイトル(英) Refining Noisy Training Examples Based on Ensemble Learning for Intelligent Domain-Specific WEB Search
サブタイトル(和)
キーワード(1)(和/英) WEB検索 / WEB search
キーワード(2)(和/英) 検索隠し味 / keyword spice
キーワード(3)(和/英) アンサンブル学習 / ensemble learning
キーワード(4)(和/英) 決定木 / decision tree
キーワード(5)(和/英) 専門検索 / domain-specific search
第 1 著者 氏名(和/英) 平林 宏基 / Hiroki HIRABAYASHI
第 1 著者 所属(和/英) 山梨大学大学院コンピュータ・メディア工学専攻
Yamanashi University
第 2 著者 氏名(和/英) 岩沼 宏治 / Koji IWANUMA
第 2 著者 所属(和/英) 山梨大学大学院コンピュータ・メディア工学専攻
Yamanashi University
第 3 著者 氏名(和/英) 山本 泰生 / Yoshitaka YAMAMOTO
第 3 著者 所属(和/英) 山梨大学大学院コンピュータ・メディア工学専攻
Yamanashi University
第 4 著者 氏名(和/英) 鍋島 英知 / Hidetomo NABESHIMA
第 4 著者 所属(和/英) 山梨大学大学院コンピュータ・メディア工学専攻
Yamanashi University
発表年月日 2010-06-25
資料番号 AI2010-5
巻番号(vol) vol.110
号番号(no) 105
ページ範囲 pp.-
ページ数 6
発行日