75. 2009/11 「仕分け」雑感 (2009/11/25)
73 で仕分けについて少し触れました。そのあとドタ
バタしてまだ結論がでていませんが、現状で思うところを少しまとめておきま
す。
個人的には意外だったのは、マスコミの論調・ネット上での色々な人の感想が
今回の理研の次世代スーパーコンピュータプロジェクトへの評価を、民主党の
科学技術に対する態度の現れ、要するに科学技術を重視しないということである、
というようなものであったことです。
これまでに何度も書いた通り、このプロジェクトはこれまでに方針設定
のミスを繰り返してきています。もっとも大きな問題なのは、開発プロジェク
トでは必須な、適切な技術状況の理解を背景にした強力なリーダーを欠いて
いたことで、そのために開発実施本部が文部科学省内の評価委員会や
総合科学技術会議内の評価 WG に振り回されたあげく、全ての関係者が
みんな不幸な、中途半端な複合型でプロジェクトを始めることになったわけで
す。そのような推進体制・過去の経緯に対して文句がついた、ということは、
現政権(財務省という話もありますが)が良く内情を理解し、正しい方向に
向かうべく指導している、という面もあると思います。
まあ、そういう状況でもメーカーさんはあまりブレることなく着実に開発を
続ける、というのは日本の「国家プロジェクト」と称するものではありがち
なわけで、途中で一抜けたした N の内情は不明ですが、 F は着実に開発を
進めてきています。
2012 年(2011年度末)の段階で 45nm で 128Gflops というのは Intel, AMD に
比べると2年遅れくらいになるのは確かです。Intel は2010 の早い時期に 8 コ
アのNehalem-EX で 100Gflops 程度、AMD も同時期に 12 コア Magny-Cours で
やはり 80 Gflops 程度までは到達しそうだからです。このことにより、価格性
能比で x86 ベースのシステムに比べると2倍程度になると思われます。
しかし、重要なポイントは、それでも N, F の現行の、7大学の計算機センター
や JAMSTEC, JAXA の納入されたシステム、つまり SX9 と FX1 に比べると飛躍
的性能向上を実現するはずである、ということです。SX9 は一声、1チップ当
りの価格が1千万で、100Gflops 程度の性能、メモリバンド幅は1チップ当り
実力で 170GB/s 程度、FX1 は40Gflops で500万、メモリバンド幅は 名目
40GB/s 実力 xxx なところです。これに対して、次世代スーパーコンピュータ
では少なくとも 8万チップのシステムを建物までいれても 1200億で構築する
わけで、チップ当りの調達コストが150万と FX1 の 1/3、建物が 1/2 とかい
う話を信じるなら 1/6 まで下がり、演算性能は3倍、メモリバンド幅もいくら
なんでも名目で2倍弱、実力では名目の 1/2 以上くらいは出るように作るでしょ
うから、演算性能で20倍近く、メモリバンド幅でも10倍近い向上です。かける
時間は3年弱なので、ムーアの法則に従うなら4倍の性能向上がせいぜいのとこ
ろを10倍、20倍といった目覚ましい性能向上になっているわけです。
言い方を変えると、価格性能比に関する限り現在は10倍近いギャップがあるの
を2倍程度までつめる画期的な成果を、マネジメント側の迷走にもかかわらず
メーカー側は実現しつつある、ということになります。まあ、チップ当りのシス
テムコストを 1/3 にどうやって引き下げたのかは私には良くわかってないの
で、額面通りに受け取っていいのかどうか?なところはありますが。
少し前に書いたように、現在の x86 ベースのシステムの優位は、 1-2 ソケッ
トノード、つまりはデスクトップ用の安価なプロセッサが 4 ソケットノード以
上用の高価なプロセッサと実質同じものであり、はるかによい価格性能比を実
現してきていた、という歴史的な事情に相当程度まで依存しています。この、
デスクトップ用プロセッサの優位、という状況は現在消滅しつつあります。
サーバ用は 8-12 コアがロードマップに見えるのに、デスクトップは当面6コア
に留まり、 GPU との1チップ化に向かうからです。GPU が統合されるなら
そっちで計算は?と思っても、主記憶バンド幅はないのでまあ N 体問題くら
いしか使えません。
さらに、AMD の Bulldozer の開発方向が本当に報道されているようなものなら、
AMD は x86 CPU に関する限り HPC マーケットを放棄したに等しく、プロセッ
サアーキテクチャとしては P4 に比べてはるかに優れていたにもかかわらず
SSE2 実行ユニットをもたないために HPC では売れなかった、P4 出現後の K7
の状況になることがあらかじめ約束されています。このことは、Intel の
ハイエンドサーバ向け x86 チップは高価なものに留まり、ソケット単価が
現在のように安いものが2011年以降に構築可能かどうかは自明ではない、と
いうことです。
おそらく、 Intel のこの状況に対する回答は Larrabee であり、それは
NVIDIA の HPC マーケットへの夢が Fermi であるのと同様に失敗を運命付け
られています。これらは(GPU として成功しなければ) HPC 以外にマーケット
をもたないものであり、HPC マーケットはプロセッサへの巨額な投資を
回収できるだけのマーケットサイズをもっていない以上、競争力をもつ
価格でシステムを提供して利益を上げることは極めて困難だからです。
では、GPU としては成功するのか?というと、 GPU マーケット
自体が統合チップセットやCPU との統合によって縮小、消滅しつつあり、
そのこと自体が NVIDIA が HPC マーケットに夢を托す理由になっているので
はないかと想像されます。これは 90年代前半に元々はグラフィックワークス
テーションメーカーであった SGI が HPC マーケットに追い込まれ、
ついには Rackable Systems に吸収されたのと同じ運命を辿らざるを得ないで
しょう。
というような様々な状況を考えると、値段設定さえなんとかなれば Venus は
そんなに悪くなく、マーケットでも戦えないとも限らないのでは、と思います。
ただ、そのためには自社の 45nm ラインでは量産能力・コストともに限界があ
り、早急に TSMC の 28nm 程度に移行する必要がありそうです。