国立天文台では今年度末にスーパーコンピューターの機種更新を行うことは前
回等にも書いていますが、9月に入札結果がでました。官報にでてるはずなの
で公知のことで、私がここでなんか書いて問題はないはずなのでちょっと書き
ます。あと、日経とかから取材もあったので。
落札したのは NEC で、システムは NEC SX の次期システム(未発表)と Crayの
XT4, NEC のは要求仕様が 1.6 Tflops 以上、XT4 はクレイジャパンの資料に
よると 824 ノード、 29 Tflops のシステムです(予備ノード含む)。レンタル
費は月額 2000万ちょっとで 60ヶ月なので総額12億円となります。XT4 と SX
次期システムのレンタル費の配分は内緒なのですが、 SX 分が例えば 2 億円
とすると(これは実際の数字ではありませんが)、 XT4 は 10億となって 1
Tflops 3400万円です。 SX の数字が正確ではないのでこの数字は誤差があり、
かなり値段が高い目の推定値です。
この値段が高いか安いかというのはなかなか難しいところがありますが、前回
推定したように東大・筑波・京大(T2K)の「オープンスパコン」は1Tflops 4000万以
上なのでこれに比べるとそこそこ安くなっています。
とはいえ、今回の我々の調達は値段だけで選んだわけではなく、ベンチマーク、
特に実際に納入される程度のノード数での並列実行での性能を重視しています。
とはいっても、実際に納入される CPU で実際に納入される規模のシステムで
のベンチマークというのを要求すると、最新の CPU を使ったものがこない、
ということになるので、今回はノード数(ないしコア数)は同じ程度で、世代が
古い CPU での実行結果から、実際に納入されるシステムでの性能を推定して
出すこと、という形にしています。
ノード数が大きいクラスタシステムではなかなかアプリケーションの性能がで
ない、というのは割合良く知られた問題で、これはアプリケーションのスケー
ラビリティだけの問題ではなく OS のチューニングができているかとか通信ラ
イブラリはどうかといった結構細かいところが効いてきます。その辺がちゃん
と出来ています、という実績を要求したわけです。
国立天文台の要求仕様は東大・筑波・京大のような新規開発を要求するもので
はありません。私達は要求仕様を各社のスカラ並列システムや PC クラスタにインフィニバンドネット
ワークをつけたもので仕様を満たすことができるように設計しています。その
代わり、実際にユーザーのプログラムで性能がでることを示して下さい、とい
う要求をつけたわけです。もちろん、これは大学の計算センターではなく、天
文台を研究する国立天文台のセンターということで代表的なアプリケーション
プログラムを選ぶのがそれほど難しいわけではない、という事情もあります。
結果的に今回はメインシステムが Cray XT4 となりました。この文章の最初の
ほう( 2 )でも書いた通り、 XT4 は微妙な位置付けのシステムであり、PC クラスタ
にインフィニバンドネットワークをつけたものに本来ならば価格では競合でき
るものではありません。実際、Cray の本国であるアメリカでは価格ではクラ
スタと競合できないけれどスケーラビリティでは圧倒的に優れている、という
ことで大口カスタマーに採用されています。しかし、現在のところ日本では大
規模な PC クラスタの値段が恐ろしく高いものになっており、さらに大規模な
PC クラスタでアプリケーションをチューニングした実績を持つベンダがあま
りない、という状況になっています。上に述べたように、T2Kの「オープンス
パコン」がCray よりも安くなかったりするわけです。これは、国内の大手メーカーが非 x86アー
キテクチャのマシンを HPC向けには出してきていた、ということにもよっており、
国内の大手メーカーに技術力がないわけではないけれど価格性能比的には非
x86 アーキテクチャのマシンは話にならないので競争力を急速に失いつつある、
ということでもあります。
例えば T2K システムのようなものを基盤に、国内メーカーが大規模クラスタ
でのアプリケーションや OS チューニング技術を早期に確立し、さらに価格的
にも競争力があるシステムを構築できるようになることが早急に必要です。
しかし、 Cray の現状をみていて思うことは、やはり HPC マーケットでその
他大勢ではないプレイヤーであるためにはなんらかの独自技術が必要である、
ということです。 XT4 では、アーキテクチャとしてはネットワークだけに独
自性があり、そこに集中していくことで現在の地位を築いたわけです。これは
T3x の 時と本質的には変わっていません。結局超並列システムではネットワー
クが最大の問題ですから、これは正しい選択でしょう。 CPU はその時点でマー
ケットにある最も良い、あるいは少なくとも最も良いものとの差がひどく大き
くないものを使えばそれでよい、というわけです。
ここで日本メーカーがするべきことは、本来は過去の日本のやり方、良く言え
ば競争相手の良いところを吸収すること、悪くいえば真似をすること、に立ち
戻ることでしょう。理研の次世代スーパーコンピューターにしても、そういっ
た展開も視野にいれて技術開発をしていかないと競争力がないものを国の税金
で開発した、という結果になってしまいます。
なお、私は x86 でスーパーコンピューター、というのが唯一の正しい方針と
は思っていません。国立天文台のスーパーコンピューターシステムも、
SX/XT4 の他に GRAPE-DR も共同利用システムとして導入し、ピーク性能やピーク性能での価
格性能比に関してはそちらのほうが良いものになります。 但し、GRAPE-DR は
現在振興調整費で開発中であり、レンタル契約に含まれる性格のものではあり
ません。そのために今回のレンタル契約には含まれていません。
GRAPE-DR も稼働するようになった時点での国内天文台のシステムは、ベクト
ル、スカラー、GRAPE-DR の3種類のアーキテクチャの複合型で、 GRAPE-DR の
部分が非常に計算インテンシブな粒子系アプリケーション等を主に実行し、
スカラ部分はスカラー並列に対応したチューニングができている大規模な流体
コード等、ベクトル部分はベクトル向けに最適化された既存の流体コード等、
とアプリケーションの種類や開発状況で使いわける、というシステムになりま
す。理研次世代で当初計画されていた複合型の理念に近いものです。
理研次世代では、前に書いたようにシングルアーキテクチャに絞る方向で検討
を進めた上で結局絞りきれなくなって2種類、となり、しかしその2種類の間に
明確な差を見つけにくいものになっていると推定されます。これはあまりに危
険な方向であり、2種類にするならそうした時点でアーキテクチャの再検討を
するべきでしょう。