座長:角谷 和俊(兵庫県立大学)
座長:角谷 和俊(兵庫県立大学)
座長:Sujeet Pradhan(倉敷芸術工科大学)
座長:国島 丈生(岡山県立大学)
座長:宮崎 純(奈良先端科学技術大学院大学)
座長:森嶋 厚行(筑波大学)
座長:有澤 博(横浜国立大学)
座長:山名 早人(早稲田大学)
座長:森川 大輔(KDDI研究所)
座長:井上 潮(東京電機大学)
座長:藤原 真二(日立製作所)
座長:田中 克己(京都大学)
座長:寺田 努(大阪大学)
座長:土方 嘉徳(大阪大学)
座長:市川 哲彦(山口大学)
座長:横田 一正(岡山県立大学)
座長:Xiaoyong Du(Remin University, China)
座長:天笠 俊之(筑波大学)
座長:喜連川 優(東京大学)
座長:Sang-goo Lee(Seoul National University, Korea)
座長:渡辺 知恵美(お茶の水女子大学)
座長:石川 博(静岡大学)
座長:増永 良文(お茶の水女子大学)
座長:大森 匡(電気通信大学)
Title: Towards a Query Optimizer for Text-Centric Tasks
Prof. Panagiotis G. Ipeirotis(New York University, USA)
Text is ubiquitous and, not surprisingly, many important applications rely on textual data for a variety of tasks. As a notable example, information extraction applications derive structured relations from unstructured text; as another example, focused crawlers explore the web to locate pages about specific topics. Execution plans for text-centric tasks follow two general paradigms for processing a text database: either scan, or "crawl," the text database or, alternatively, exploit search engine indexes and retrieve the documents of interest via carefully crafted queries constructed in task-specific ways. The choice between crawl- and query-based execution plans can have a substantial impact on both execution time and output "completeness" (e.g., in terms of recall). Nevertheless, this choice is typically ad-hoc and based on heuristics or plain intuition.
In this talk, we present fundamental building blocks to make the choice of execution plans for text-centric tasks in an informed, cost-based way. Towards this goal, we show how to analyze query- and crawl-based plans in terms of both execution time and output completeness. We adapt results from random-graph theory and statistics to develop a rigorous cost model for the execution plans. The cost model reflects the fact that the performance of the plans depends on fundamental task-specific properties of the underlying text databases. We identify these properties and present efficient techniques for estimating the associated parameters of the cost model. We also present two optimization approaches for text-centric tasks that rely on the cost-model parameters and select efficient execution plans. Overall, our optimization approaches help build efficient execution plans for a task, resulting in significant efficiency and output completeness benefits.
座長:清木 康(慶應義塾大学)
タイトル:大規模データベースシステムに関する研究動向
星野喬(東京大)
本サーベイでは,e-business,e-science 等を支える基盤である大規模データ ベースシステム技術を概説し,特に大容量データの処理,管理を高いコストパ フォーマンスで実現するための技術に関する最新の研究動向を紹介する.
座長:鬼塚 真(NTT)
座長:原 隆浩(大阪大学)
座長:中島 伸介(奈良先端科学技術大学院大学)
座長:石川 佳治(名古屋大学)
座長:中野 美由紀(東京大学)
座長:太田 学(岡山大学)
座長:成 凱(九州産業大学)
座長:飯沢 篤志(リコー)
座長:富井 尚志(横浜国立大学)
座長:小口 正人(お茶の水女子大学)
座長:土田 正士(日立製作所)
座長:天笠 俊之(筑波大学)
座長:松澤 裕史(日本アイ・ビー・エム)
座長:牛尼 剛聡(九州大学)
座長:義久 智樹(京都大学)
DEWS 2007 Hiroshima, IEICE