講演名 2015-01-29
GPUを用いたドキュメント指向型データベースの高速化(データベース・NoC,FPGA応用及び一般)
森島 信, 松谷 宏紀,
PDFダウンロードページ PDFダウンロードページへ
抄録(和) ドキュメント指向型データベースは、ユーザーが作成したドキュメントをスキーマレスに保存し、それに対する探索クエリを実行でき、水平分散を行えるデータベースであり、豊富な機能と拡張性を持っている。そのため、多くの文書を扱うwebアプリケーションなどで広く用いられている。ドキュメント指向型データベースの主な処理は文字列探索であり、情報量に比例して計算量が増えるため、膨大な情報を扱う場合の文字列探索の計算量は大きい。ドキュメント指向型データベースは、インデックスを用いてこれを高速化しているが、文字列の部分一致など、インデックスを使えないクエリが存在し、これらのクエリがボトルネックとなる。そこで、本論文では、GPU処理に適した構造のDDBキャッシュ(Document-oriented DataBaseキャッシュ)を提案し、これに対する処理をGPUで高速化する。この手法で、ドキュメント指向型データベースの枠組みを維持しつつ、インデックスによって高速化できない文字列の部分一致などのクエリを含めた文字列探索を高速化できる。一件あたり16文字の文字列を含むドキュメント一億件に対する文字列部分一致の探索の実行時間を評価した結果、代表的なドキュメント指向型データベースであるMongoDBの高速化に成功した。
抄録(英) Document-oriented store is a database, in which users can store their documents in a schema-less manner and perform search queries for them. They have been widely used for web applications that process a large collection of documents because of their high scalability and rich functions. One of major functions of document-oriented databases is string search that requires a high computational power for a large collection of documents, because its computational complexity increases as the information increases. In a document-oriented database, secondly-index is typically used for improving the text search queries. However, the secondly-index cannot be always used for text search queries, such as partial match retrieval. To accelerate such queries by using GPUs, in this paper, we propose a GPU-friendly cache structure called DDB Cache (Document-oriented DataBase Cache) which is extracted from a document-oriented database. By using GPUs and DDB Cache, we can improve performance of text search queries without relying on the secondly-index. As experiments, we implemented DDB Cache for MongoDB and performed partial string match queries for a hundred million records (each contains a 16 character string) by using GPUs. The results show a significant performance improvement.
キーワード(和) 構造型ストレージ / ドキュメント指向型データベース / GPU
キーワード(英) Structured storage / document-oriented database / GPUs
資料番号 VLD2014-113,CPSY2014-122,RECONF2014-46
発行日

研究会情報
研究会 RECONF
開催期間 2015/1/22(から1日開催)
開催地(和)
開催地(英)
テーマ(和)
テーマ(英)
委員長氏名(和)
委員長氏名(英)
副委員長氏名(和)
副委員長氏名(英)
幹事氏名(和)
幹事氏名(英)
幹事補佐氏名(和)
幹事補佐氏名(英)

講演論文情報詳細
申込み研究会 Reconfigurable Systems (RECONF)
本文の言語 JPN
タイトル(和) GPUを用いたドキュメント指向型データベースの高速化(データベース・NoC,FPGA応用及び一般)
サブタイトル(和)
タイトル(英) Performance Acceleration of Document-Oriented Stores Using GPUs
サブタイトル(和)
キーワード(1)(和/英) 構造型ストレージ / Structured storage
キーワード(2)(和/英) ドキュメント指向型データベース / document-oriented database
キーワード(3)(和/英) GPU / GPUs
第 1 著者 氏名(和/英) 森島 信 / Shin MORISHIMA
第 1 著者 所属(和/英) 慶應義塾大学大学院理工学研究科
Graduate School of Science and Technology, Keio University
第 2 著者 氏名(和/英) 松谷 宏紀 / Hiroki MATSUTANI
第 2 著者 所属(和/英) 慶應義塾大学大学院理工学研究科:科学技術新興機構さきがけ:国立情報学研究所
Graduate School of Science and Technology, Keio University:PRESTO, Japan Science and Technology Agency:National Institute of Informatics
発表年月日 2015-01-29
資料番号 VLD2014-113,CPSY2014-122,RECONF2014-46
巻番号(vol) vol.114
号番号(no) 428
ページ範囲 pp.-
ページ数 6
発行日