./note054.html

ToC

53. 次世代、ペタスケール、T2K (2007/8/12)

次世代スーパーコンピューターは、 CSTP 評価専門調査会には報告原案がでたとのことで、まあ承認されたものと思われます。文部科学省の評価なんとかではゴタゴタした割にはこちらはすんなりいったようです。まあ、委員の面子を見るとそんなものかなという気もします昨年10月のレポートの「フォローアップ検討会名簿」と比べると、土居さんと小柳さんが外れて、その代わりに中辻さんという人がはいっています。つまり、計算機ハードウェアや HPC の専門家はいなくなった委員会で評価を行ったわけです。

まあ、土居さんと小柳さんは文部科学省のほうの委員会に入ってたからこっちは外れたのか、と思ったら VDEC の浅田さんははいったままですね。なんかそんなのでいいのかという気がします。

そんな委員会ならシャンシャンで終わったのか、と思うとどうもそうでもないようで、上のレポートの「補足3 評価コメント」とかを見ると

      提案する概念設計は当初の速度性能目標達成可能性において「あり得る
      一つの形態」と判断され妥当は範囲と考えられる。代替案に比較して性
      能上大きな差は見られないものの、(以下略)

とか他にも結構凄いことが色々書いてあって、CSTP としてはこれが上手くいかなかった時に「だからいったじゃないか」と責任のがれができるような方向にまとめているように思います。(評価報告としてはこれは当然のことで別に責任のがれが悪いとは私は思いません)

が、そんなこんなで日本のプロジェクトが足踏みしている間にアメリカでも同じような話が進むわけで、 NSF のペタスケールの話がリリースされました。 HPC wire の報道によると

2011 年完成
IBM Bluewater をイリノイ大学に
ピーク性能は 10 ペタフロップスらしい

とのこと。これは、 CMU-Intel の 40Pflops、 UCSD-IBM(BG/Q) 20Pflops、 U Tennessee/ONRL-Cray 20Pflops を押しのけて採択されたものだそうです。で、「何故こんな選択を」とか「決定プロセスが不透明すぎ」みたいな声がでてるとか。どっかで聞いたような話です。一つのポイントは、しかし、このペタスケールの話は「わずか」 2.08億ドルの話だということで、日本の次世代とは速度が同じで値段が 1/5 なわけです。もちろん、これは DARPA がお金を出した HPCS の成果をそのまま買ってくるから、という面もありますが、HPCS 自体もそれほど巨額ではないので、何故日本ではそんなにお金がかかるんだ？という点はやはり問題です。

さて、次世代スーパーコンピューターへの対抗、という意味合いもあって日本の大学の計算センターは色々やっているわけですが、その中でも大きなものが T2K、あるいは「オープンスパコン」の名で知られるプロジェクトです。これは、今年度終わりから来年度初めにかけての時期に、筑波大学、東大、京大の3大学でほぼ共通仕様のスパコンを入れる、というものです。

スーパーコンピューターの導入というのはなんだかとても面倒で手数のかかるものです。今年度国立天文台でも導入しますが、入札公告にある通り

5/25 公示
7/27 入札書受領期限
9/14 開札

で、実際の納入、運用開始は年度末あたりを予定しています。実はその前にさらにステップがあって

資料等の提供招請大体公示の1年前
仕様書案に対する意見招請公示の数ヶ月前

というようなことをしないといけません。スーパーコンピューターの定義は、少なくとも天文台で検討を始めた昨年度は 1.5Tflops 以上、というもので、 GPU なんかどうするんだろうと思いますがまあそれはそれとして、クラスタとか買う時には結構面倒です。

T2K では「資料等の提供招請」はこんな感じです。(2008/1/4 注記:左のリンクは現在見えなくなってます。ここから「資料等の提供招請」、「スーパーコンピューター」、「東京大学」、「2006/1/1-2007/1/1」を選択して下さい」)「要求要件」が問題ですが、以下の通りです。(どうでもよいところは省略してます)

 　(6) 調達に必要とされる基本的な要求要件

 　　Ａ　今回導入するスーパーコンピュータシステムは、超並列型スー
 　　　パーコンピュータシステムである。超並列型スーパーコンピュー
 　　　タシステムは複数ノードで構成される高並列型計算機であること。
 　　　ここで、ノードとは、主記憶を共有する１台以上のCPUから構成さ
 　　　れるコンピュータシステムであると定義する。ノード単体あたりの
 　　　理論ピーク演算性能が160 GFLOPS以上（倍精度浮動小数点演算）で
 　　　あり、かつ理論ピーク演算性能の総和が150 TFLOPS以上（倍精度浮
 　　　動小数点演算）であること。実効演算性能については、ベンチマーク
 　　　により評価する。
 　　Ｂ　ノード単体あたりの主記憶容量は32 GByte以上であり、かつ総主記憶
 　　　容量は30 TByte以上であること。全ノードの内、16ノード以上は128
 　　　GByte以上の主記憶容量を有すること。
 　　Ｃ　CPUは64ビット拡張されたIA32アーキテクチャに基づくものであるこ
 　　　と。 
 　　Ｄ　各ノードが備えるノード間接続のためのネットワークリンクのデー
 　　　タ転送速度の理論ピーク値が、１ノードあたり５ GByte/秒以上である
 　　　こと。 
 　　Ｅ　ノード毎に総計250 GByte以上の物理容量を有する磁気ディスクドラ
 　　　イブ群を備えること。当該の磁気ディスクドライブ群はRAID-１による
 　　　運用が可能であること。 
 　　Ｌ　全ノードのうち半数以上のノードがフルバイセクションバンド幅で
 　　　接続されること。残りのノードにおいては、多数のノードでフルバイ
 　　　セクションバンド幅が確保されることが望ましい。

これは「資料提供招請」であって仕様書ではないものですが、文章の最初に

    次のとおり物品の導入を予定していますので、

とあり、この段階で書いた要求要件と最終仕様が大きく違うようでは資料提供招請の意味がないので、あまり変えることはできません。つまり、

1ノードは 160Gflops 以上、メモリ 32GB 以上
CPU は x86-64
ネットワークはノードのところで 5GB/s 以上
全ノードの半分以上が「フルバイセクションバンド幅」で接続
拡張ノードに 250GB 以上のディスクを 2 台以上

というあたりはほぼ固定されたものです。ノードは、今年から来年にかけてでるものでの選択肢は

Intel Tigerton + 7300 チップセット、 4 ソケット
AMD Barcelona 、 4 ソケット

で、クロック 2.5 GHz 以上必要、となります。消費電力の観点ではメモリ回りで滅茶苦茶電気を食う FB-DIMM を使う7300 チップセットは避けたいところですから、普通は AMD を使うことになります。メモリバンド幅やレイテンシでもかなり大きな差があります。が、AMD は 2.5 GHz の出荷が一応年内となってますが数はそろうんだろうか？みたいな情勢です。そうすると、システムが納入可能かどうか難しいところになります。

で、少なくとも公開資料からは何がどうなってるかわからないのですが、T2K システムについて仕様書案に対する意見招請もまだでていない段階のようです。普通に考えると年度内の納入はありえない、というところです。まあ、事務処理には色々ワザがあるんでしょうから、なんとかなるのかもしれません。

この情報提供招請のもうひとつの特徴は

   既存の製品を排除する要求要件になっている

ことです。まず、 4 ソケットということで Cray は入りません。次に、ネットワークが 5GB/s 以上、というところでほぼ自動的に各社が持っているブレードや高密度サーバは仕様を満たすものではなくなり、新規にマザーボードや場合によってはスイッチも開発が必要になります。まあ、スイッチは Sun の Magnum スイッチでもいいのですが、とにかくこのプロジェクト用に色々新規開発してくれるところでないと入らないわけです。

ノード当り 5GB/s もの速度がどういうアプリケーションで必要なのかどれほど検討したのか知りませんが、オープンスパコンといいながら既存製品では駄目、という仕様を書くのはちょっといってることとやってることに差があるような気がしなくもありません。

と、人のところの調達に勝手なことを書いてますが、実際、国立天文台の仕様書はこういう細かい指定はなしで、適当にある機械をもってくればいい、でもベンチマークで性能はもってきてね、というものにしています。で、とりあえず入札とかのプロセスはスケジュール通り進んでいます。

おそらく、「オープンスパコン」という言葉の意味は、計算センタースタッフが設計した機械をどこかのメーカーに作らせる、でも、チップとかの新規開発はなしで出来合いの部品を使う、というものなのでしょう。これはこれで悪い方針ではないと思うのですが、設計は悪いと思います。まず、4ソケットを必要条件としているところで恐ろしく高価なものになります。Intel の現在/将来の価格は、そこそこクロックの高いモデルで大雑把にいって

  1ソケット用(Core 2 Quad) 5万円
  2ソケット用(Xeon 5000)  10万円
  4ソケット用(Xeon 7000)  20万円

といったところで、4ソケットのノード1つには CPU だけで 80万円ですが、 1ソケット4ノードなら 20万円ですむわけです。もちろんネットワークとかがあるのでこれだけで価格が決まるわけではないですが、1ノードの中で収まるような計算しかしないのならともかく、 4000ソケットも導入するなら全部 4 ソケットノード、というのは価格性能比的にどんなものかと思います。もちろん、 TSUBAME のようにどういうわけか知らないけど恐ろしく安い、というものならその限りではないのですが、T2K は現在のレンタル料金(東大の場合月額1億以上)から見るとそれほど安くはならないと思われます。単純に5 年レンタル、60億、4000ソケットとすると1ソケット 150万円になるからです。この150万円の中で CPU を買ってくる値段が 1/8 以上を占めるわけで、全体価格を引き上げることにかなり貢献していると思われます。

が、単に4ソケット、というだけなら高いにしても各社製品をもっているので、価格競争が成り立ちます。しかし、さらにネットワークで独自仕様とかにすると作ってくれるところが限られ、さらに初めからそういう、作ってくれるといったところがいってきた価格を想定したような資料提供招請の要件になっているわけです。

こういうのは結果が問題でプロセスは本質的ではないのですが、プロセスを始める時点で結果がそこそこでしかないとわかり、しかもそのそこそこの結果も予定通りにはいかない、というのはちょっとどんなものかと思います。

Previous ToC Next