講演抄録/キーワード |
講演名 |
2014-03-07 10:40
データ転送量を考慮したHadoopスケジューラ改善方式の提案と評価 ○渡邊飛雄馬・川原崎雅敏(筑波大) IN2013-173 |
抄録 |
(和) |
現在広く使われている大規模データ分散処理フレームワークであるHadoopは、データ転送にかかる時間が処理時間の多くを占めている。本論文では、処理ノードのネットワーク使用率とHDD使用率を考慮してノードにタスクを割り当てるスケジューリング方式を提案し、データ転送かかる時間を短縮する。また、研究室内に構築したHadoopクラスタと、Amazon EC2上に構築したHadoopクラスタの両方を用いてその性能を評価する。 |
(英) |
Data transfer time occupies large amount of Hadoop job processing time. In this paper, we propose new Hadoop task scheduling algorithms which take account of network I/O and HDD I/O usage rate of task trackers to shorten the time for data transfer. We evaluate our algorithms on two type of Hadoop cluster which consists of real-machines in laboratory or virtual machine on Amazon EC2. |
キーワード |
(和) |
Hadoop / MapReduce / 分散コンピューティング / タスクスケジューリング / ジョブパフォーマンス / / / |
(英) |
Hadoop / MapReduce / Distributed computing / Task scheduling / Job performance / / / |
文献情報 |
信学技報, vol. 113, no. 473, IN2013-173, pp. 175-180, 2014年3月. |
資料番号 |
IN2013-173 |
発行日 |
2014-02-27 (IN) |
ISSN |
Print edition: ISSN 0913-5685 Online edition: ISSN 2432-6380 |
著作権に ついて |
技術研究報告に掲載された論文の著作権は電子情報通信学会に帰属します.(許諾番号:10GA0019/12GB0052/13GB0056/17GB0034/18GB0034) |
PDFダウンロード |
IN2013-173 |