研究室めぐり

技術研究組合 新情報処理開発機構 並列分散システムソフトウエアつくば研究室

新情報処理開発機構 つくば研究センタ 石川 裕

 技術研究組合新情報処理開発機構では、将来の本格的インターネット・マルチメディア社会における多様な計算処理需要に応えるために必要な基礎技術の研究開発を行ってきております。パソコン市場の増大、デバイス技術の進歩により、パソコンの価格性能比が向上し安価で高速なコンピュータが容易に手に入るようになりました。標準パソコンを高速ネットワークで結合するとハードウエア性能(理論性能値)としてはスーパーコンピュータ並みの処理能力を得ることが可能です。しかし、単純に市販のパソコンをつなげただけでは、保守性ならびに設置面積において問題が生じ、また、コンピュータの性能を引き出す基本ソフトウエアの欠如によりスーパーコンピュータ並みのシステムを実現することはできません。
 そこで、並列分散システムソフトウエアつくば研究室では、このような諸問題を解決して、パソコンによるスーパーコンピュータ並みのコンピュータシステム(スーパーパソコンシステム)の実現を目指して、1995年よりSun社ワークステーションおよびIntel社PentiumによるPCを用いたクラスタシステムの開発を進めてきております。
 1997年秋には、64台のパソコンをつないだスーパーパソコンシステムRWC PCクラスタ2号機を完成させ、本年夏に128台に拡張しました。CPUとしてパーソナルコンピュータで利用されている米インテル社製Pentium Pro(200MHz)と主記憶256MBを搭載した回路基板およびハードディスク4GBから構成されるコンピュータ128台を米ミリコム社製Myrinet高速ネットワークによりつないでいます。RWC PCクラスタ2号機では、プロセッサと主記憶が搭載されている回路基板に米国工業団体PICMG(PCI Industrial Computer Manufactures Group)仕様を採用することにより、多数のパーソナルコンピュータを使いながらも保守性に優れかつコンパクトなスーパーパソコンシステムとなっています(図1)。

図1 RWC PC Cluster 2号機

 我々はSCore Cluster System Softwareというソフトウエアアーキテクチャをクラスタ上に実現しています(図2)。オペレーティングシステムカーネルであるLinux、NetBSD、SunOSを改変することなく、通信ドライバ、ユーザレベルライブラリ、デーモンプロセスにより、マルチユーザ高性能並列計算環境を実現しています。

図2 SCore Cluster System Software アーキテクチャ

 PM通信ライブラリはMyrinetネットワークインターフェイスカードのファームウエアであるプログラムを書き直し、ユーザプロセスとユーザプロセス同士の8 Bytesメッセージ通信時間(ラウンドトリップ時間)で15 micro seconds、また、通信バンド幅で100 MBytes/sec以上の高性能通信を実現しています。この性能は、従来のTCP/IPのようなネットワーク機能の上に構築された通信ライブラリと比較して数十倍程度の性能向上を達成しています。
 また、並列プログラミングで一般に使われているMPI通信ライブラリを実現するために、フリーでソースコードが入手できるMPI通信ライブラリであるMPICHをPM上に実装しております。米国NASA(航空宇宙局)が開発したベンチマークプログラム集による性能計測の結果として既存の最新鋭スーパーコンピュータであると同程度の性能が達成されていることを確認しています。
 並列オペレーティングシステムSCore-Dは、UNIXを改変することなく複数の並列応用プログラムを効率的にスケジューリングする機能を実現しています。ネットワークドライバPMとの協調により高性能処理を損なうことなく複数ユーザが利用できる環境を実現しています。
 MPC++プログラミング言語はC++が持つテンプレート機能を用いて、並列処理記述のプリミティブとして、リモート関数呼び出し、リモートメモリアクセス、同期機構、リダクション等のグローバル操作を実現しています。また、メタレベル機能を備えたコンパイラにより、ライブラリ提供者がライブラリに特化した最適化を実現できる枠組みを提供すべく開発を進めています。
 クラスタ技術の次のステップとして、新情報処理開発機構では、異なるアーキテクチャの計算機群の上で、その異機種性をユーザに意識することなくプログラミングを可能とするシームレス並列分散システムの研究開発を行っています。RWC PCクラスタ2号機はこのための研究インフラの一つとして使われます。異機種環境上で実験するためにはPC以外のアーキテクチャによるクラスタが必要であります。そこで、DEC社Alpha 21164Aプロセッサを32台利用したRWC Alphaクラスタも製作しました。
 新情報処理開発機構では、SCoreシステムを利用して頂き、ユーザからのフィードバックによるさらなるシステムの改良を目的として、WEB経由で許諾書ベースにシステムソフトウエアの配布を以下のURLで行っています。

http://www.rwcp.or.jp/lab/pdslab/dist/

我々が開発したSCoreシステムはMyrinetネットワークによって接続されたクラスタシステム上でしか稼働しません。現在、Gigabit Ethernet上でも高性能通信を実現したSCoreシステムが動くように開発を進めると共に、既存通信プロトコル上でも稼働するように開発を進めています。