講演抄録/キーワード |
講演名 |
2013-10-04 14:30
NICTサイエンスクラウド ~ 地球科学・宇宙科学ビッグデータ分散処理技術 ~ ○磯田総子(サイエンスサービス)・村田健史・渡邉英伸(NICT)・深沢圭一郎(九大/NICT)・山本和憲・久保田康文・笠井康子・佐藤晋介(NICT)・鵜川健太郎・村永和哉・鈴木 豊(セック)・黒澤 隆(日立ソリューションズ東日本)・木村映善(愛媛大)・建部修見・田中昌宏(筑波大) PRMU2013-62 |
抄録 |
(和) |
データ指向型科学は第4の科学と言われており,観測・実験や数値シミュレーションによる膨大なデータを解析することによる新しい科学を目指している.NICTサイエンスクラウドは科学研究を主目的としたクラウドシステムであり,特に宇宙環境科学や地球環境科学といった自然科学のビッグデータサイエンスを主対象の一つとしている.10TBを超えるデータ処理(例えば大規模可視化)や100TBを超える観測データ検索(たとえば特徴検出)などはこれからの地球および宇宙科学ではますます重要になる.本研究では,NICTサイエンスクラウドにおいて,Gfarmにより実装した広域分散ストレージ上のデータファイルを30ノード・320コアから構成されるクライアントノードにより高速に読み出す技術開発を行った.Pwrakeによるタスクスケジューリングを用い,データ読み込みプロセス数を最適化し,さらにファイル配置を工夫することにより,約19GB/s(150Gbps)でのデータ読み出しに成功した. |
(英) |
Science cloud is a cloud system designed for scientific researches, and expected as a new infrastructure for big data sciences. Not only parallelization of CPU as in super-computers, but I/O and network throughput parallelization are crucial for the big data science. One of the typical structures of science cloud is a scalable cluster in which multiple clusters in a cloud are connected with high-speed network. In the present study, we study a performance of parallelization of both CPU and I/O inside a cloud as a first step to the high performance scalable clusters. In case with few processes executed on each computational node (server), parallelization efficiency is almost 100%. This high efficiency is expected to maintain in larger-scale cluster systems such as those with 30 servers. On the other hand, under the condition of multi-processes on each node, the present parallelization does not show good performance due to the congestions of I/O. Parallelization efficiency is as low as 15.6. New techniques of decentralization of I/O within each node are required in the next step. |
キーワード |
(和) |
サイエンスクラウド / Gfarm / Pwrake / ビッグデータ / 宇宙環境科学 / 地球環境科学 / / |
(英) |
Science Cloud / Gfarm / Pwrake / Big data / Earth Environment Science / Space Environment Science / / |
文献情報 |
信学技報, vol. 113, no. 230, PRMU2013-62, pp. 29-34, 2013年10月. |
資料番号 |
PRMU2013-62 |
発行日 |
2013-09-26 (PRMU) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
PRMU2013-62 |