./note055.html

ToC

54. 国立天文台の次期システム (2007/10/11)

国立天文台では今年度末にスーパーコンピューターの機種更新を行うことは前回等にも書いていますが、9月に入札結果がでました。官報にでてるはずなので公知のことで、私がここでなんか書いて問題はないはずなのでちょっと書きます。あと、日経とかから取材もあったので。

落札したのは NEC で、システムは NEC SX の次期システム(未発表)と Crayの XT4, NEC のは要求仕様が 1.6 Tflops 以上、XT4 はクレイジャパンの資料によると 824 ノード、 29 Tflops のシステムです(予備ノード含む)。レンタル費は月額 2000万ちょっとで 60ヶ月なので総額12億円となります。XT4 と SX 次期システムのレンタル費の配分は内緒なのですが、 SX 分が例えば 2 億円とすると(これは実際の数字ではありませんが)、 XT4 は 10億となって 1 Tflops 3400万円です。 SX の数字が正確ではないのでこの数字は誤差があり、かなり値段が高い目の推定値です。

この値段が高いか安いかというのはなかなか難しいところがありますが、前回推定したように東大・筑波・京大(T2K)の「オープンスパコン」は1Tflops 4000万以上なのでこれに比べるとそこそこ安くなっています。

とはいえ、今回の我々の調達は値段だけで選んだわけではなく、ベンチマーク、特に実際に納入される程度のノード数での並列実行での性能を重視しています。とはいっても、実際に納入される CPU で実際に納入される規模のシステムでのベンチマークというのを要求すると、最新の CPU を使ったものがこない、ということになるので、今回はノード数(ないしコア数)は同じ程度で、世代が古い CPU での実行結果から、実際に納入されるシステムでの性能を推定して出すこと、という形にしています。

ノード数が大きいクラスタシステムではなかなかアプリケーションの性能がでない、というのは割合良く知られた問題で、これはアプリケーションのスケーラビリティだけの問題ではなく OS のチューニングができているかとか通信ライブラリはどうかといった結構細かいところが効いてきます。その辺がちゃんと出来ています、という実績を要求したわけです。

国立天文台の要求仕様は東大・筑波・京大のような新規開発を要求するものではありません。私達は要求仕様を各社のスカラ並列システムや PC クラスタにインフィニバンドネットワークをつけたもので仕様を満たすことができるように設計しています。その代わり、実際にユーザーのプログラムで性能がでることを示して下さい、という要求をつけたわけです。もちろん、これは大学の計算センターではなく、天文台を研究する国立天文台のセンターということで代表的なアプリケーションプログラムを選ぶのがそれほど難しいわけではない、という事情もあります。

結果的に今回はメインシステムが Cray XT4 となりました。この文章の最初のほう( 2 )でも書いた通り、 XT4 は微妙な位置付けのシステムであり、PC クラスタにインフィニバンドネットワークをつけたものに本来ならば価格では競合できるものではありません。実際、Cray の本国であるアメリカでは価格ではクラスタと競合できないけれどスケーラビリティでは圧倒的に優れている、ということで大口カスタマーに採用されています。しかし、現在のところ日本では大規模な PC クラスタの値段が恐ろしく高いものになっており、さらに大規模な PC クラスタでアプリケーションをチューニングした実績を持つベンダがあまりない、という状況になっています。上に述べたように、T2Kの「オープンスパコン」がCray よりも安くなかったりするわけです。これは、国内の大手メーカーが非 x86アーキテクチャのマシンを HPC向けには出してきていた、ということにもよっており、国内の大手メーカーに技術力がないわけではないけれど価格性能比的には非 x86 アーキテクチャのマシンは話にならないので競争力を急速に失いつつある、ということでもあります。

例えば T2K システムのようなものを基盤に、国内メーカーが大規模クラスタでのアプリケーションや OS チューニング技術を早期に確立し、さらに価格的にも競争力があるシステムを構築できるようになることが早急に必要です。

しかし、 Cray の現状をみていて思うことは、やはり HPC マーケットでその他大勢ではないプレイヤーであるためにはなんらかの独自技術が必要である、ということです。 XT4 では、アーキテクチャとしてはネットワークだけに独自性があり、そこに集中していくことで現在の地位を築いたわけです。これは T3x の時と本質的には変わっていません。結局超並列システムではネットワークが最大の問題ですから、これは正しい選択でしょう。 CPU はその時点でマーケットにある最も良い、あるいは少なくとも最も良いものとの差がひどく大きくないものを使えばそれでよい、というわけです。

ここで日本メーカーがするべきことは、本来は過去の日本のやり方、良く言えば競争相手の良いところを吸収すること、悪くいえば真似をすること、に立ち戻ることでしょう。理研の次世代スーパーコンピューターにしても、そういった展開も視野にいれて技術開発をしていかないと競争力がないものを国の税金で開発した、という結果になってしまいます。

なお、私は x86 でスーパーコンピューター、というのが唯一の正しい方針とは思っていません。国立天文台のスーパーコンピューターシステムも、 SX/XT4 の他に GRAPE-DR も共同利用システムとして導入し、ピーク性能やピーク性能での価格性能比に関してはそちらのほうが良いものになります。但し、GRAPE-DR は現在振興調整費で開発中であり、レンタル契約に含まれる性格のものではありません。そのために今回のレンタル契約には含まれていません。

GRAPE-DR も稼働するようになった時点での国内天文台のシステムは、ベクトル、スカラー、GRAPE-DR の3種類のアーキテクチャの複合型で、 GRAPE-DR の部分が非常に計算インテンシブな粒子系アプリケーション等を主に実行し、スカラ部分はスカラー並列に対応したチューニングができている大規模な流体コード等、ベクトル部分はベクトル向けに最適化された既存の流体コード等、とアプリケーションの種類や開発状況で使いわける、というシステムになります。理研次世代で当初計画されていた複合型の理念に近いものです。

理研次世代では、前に書いたようにシングルアーキテクチャに絞る方向で検討を進めた上で結局絞りきれなくなって2種類、となり、しかしその2種類の間に明確な差を見つけにくいものになっていると推定されます。これはあまりに危険な方向であり、2種類にするならそうした時点でアーキテクチャの再検討をするべきでしょう。

Previous ToC Next