講演抄録/キーワード |
講演名 |
2013-01-24 16:30
UBI-Treeを用いたスキーマレスデータの高品質なチャンク生成方式の提案と評価 ○森 皓平・荒川 豊・中村隆幸・中村元紀・松村 一(NTT) USN2012-62 |
抄録 |
(和) |
本稿では,ユビキタスデータ共有機構uTupleSpaceが管理する膨大な種類と量のスキーマレスデータの高速検索を可能にする,高品質なチャンク生成方式を提案する.uTupleSpaceは膨大な量のデータの履歴を蓄えるため,データをチャンクと呼ばれるアーカイブファイルへと自動的に書き写し,テーブルのサイズを一定に抑える手法を用いている.この手法はさらに,生成されたチャンクをユーザに直接配信出来るという利点がある.これによりサーバ側は転送負荷を低減でき,またユーザ側はデータマイニング時等に大量データの取り扱い容易性が得られる.提案方式は,スキーマレスなデータの索引付け技術であるUBI-Treeをチャンク生成に用いることで,高品質すなわち特定種類のデータ群をまとめて格納したチャンクの生成を可能にし,こうした利点を更に大きくする.我々はさらに提案方式を実装し,疑似データを用いて実験を行うことでその効果を検証し,有効性を確認した. |
(英) |
We propose a method for creating high-quality chunks which enables efficient search of a good deal and wide variety of schema-less data managed by the uTupleSpace ubiquitous data sharing system. To store a huge number of data records, the uTupleSpace uses a chunk creation method which automatically moves data in a table to archive files called chunks to maintain the size of the table constant. Moreover, chunks at servers can be sent to users directly, enabling easy data handling at the users side and a reduction of the transfer load at the servers side. To increase these benefits, the proposed method uses UBI-Tree when making chunks. UBI-Tree is an indexing method for schema-less data and enables to make high-quality chunks, which means that data are classified to each chunks according to the type of data. We implemented proposed method and conducted experiments using simulated data to confirm the validity of the proposal. |
キーワード |
(和) |
UBI-Tree / スキーマレス / uTupleSpace / データベース / チャンク / / / |
(英) |
UBI-Tree / schema-less / uTupleSpace / Database / chunk / / / |
文献情報 |
信学技報, vol. 112, no. 406, USN2012-62, pp. 33-38, 2013年1月. |
資料番号 |
USN2012-62 |
発行日 |
2013-01-17 (USN) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
USN2012-62 |
|