講演名 2004/7/7
リージョンディレクトリを用いた関係データベースによる大規模XMLデータ処理(セッション4B : XML2)(夏のデータベースワークショップ : DBWS2004)
天笠 俊之, 植村 俊亮,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) 本稿では,関係データベースを基盤としたXMLデータベースにおいて,大規模XMLデータの効率的な処理を実現するための手法を提案する.大規模XMLデータでは,その性質からサイズ以上にノード数が増加するため,関係データベース上での問合せ処理が効率的に行えないという問題がある.しかしながら,多くの場合,ある問合せを処理のにXMLデータ全体は必ずしも必要ではなく,問合せに応じたデータの一部分さえあれば十分であることが多い.本稿では,このデータアクセスの局所性をうまく利用するために,ディスク上に置かれたXMLデータから,問合せ処理に必要な部分のみを関係表へ動的にマッピングする手法を考案した.これはStrong Data Guideに基づいたデータ構造であるリージョンディレクトリによって実現される.すなわち単純経路式から対応するXML部分データを知ることができ,その部分を関係表への動的にマッピング(アンマッピング)することによって,問合せ処理に不要な部分を関係表の上におく必要がなくなる.関係表のタプル数が減少するため,全体を一様にマップする従来手法より効率的な検索処理が期待できる.
抄録(英) This paper proposes a scheme for processing large-scale XML data efficiently by RDBMS-based XML databases. From the nature of XML data, their data size gives serious impact on the performance of query performance on RDBMS, due to the fact that the number of nodes grows quickly as the data size increases. However, in many cases, the entire XML data is not always necessary for processing XML queries, that is, only small portion is enough for answering the queries. This paper, therefore, attempts to develop a scheme for dynamically map (unmap) partial XML data to (from) relational tables that are necessary for given queries. To this end, a data structure called "region directory" is introduced. In fact, region directory is based on a well-known data structure, Strong DataGuides, that is used to compute summary of graph-structured data. A region directory enables us to know the regions of XML data related to a path expression. We can thus dynamically map (unmap) partial XML data to (from) relational tables. As a consequence, relational tables only contains relatively small numbers of tuples enough for processing particular XML queries, and this leads more efficient query processing than existing schemes.
キーワード(和) XMLデータベース / リージョンディレクトリ / 単純経路式
キーワード(英) XML databases / region directory / simple path expressions
資料番号 DE2004-49
発行日

研究会情報
研究会 DE
開催期間 2004/7/7(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Data Engineering (DE)
本文の言語 JPN
タイトル(和) リージョンディレクトリを用いた関係データベースによる大規模XMLデータ処理(セッション4B : XML2)(夏のデータベースワークショップ : DBWS2004)
サブタイトル(和)
タイトル(英) Processing Large-Scale XML Data by RDBMS using Region Directory
サブタイトル(和)
キーワード(1)(和/英) XMLデータベース / XML databases
キーワード(2)(和/英) リージョンディレクトリ / region directory
キーワード(3)(和/英) 単純経路式 / simple path expressions
第 1 著者 氏名(和/英) 天笠 俊之 / Toshiyuki AMAGASA
第 1 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
第 2 著者 氏名(和/英) 植村 俊亮 / Shunsuke UEMURA
第 2 著者 所属(和/英) 奈良先端科学技術大学院大学情報科学研究科
Graduate School of Information Science, Nara Institute of Science and Technology
発表年月日 2004/7/7
資料番号 DE2004-49
巻番号(vol) vol.104
号番号(no) 177
ページ範囲 pp.-
ページ数 6
発行日