./note076.html

ToC

75. 2009/11 「仕分け」雑感 (2009/11/25)

73 で仕分けについて少し触れました。そのあとドタバタしてまだ結論がでていませんが、現状で思うところを少しまとめておきます。

個人的には意外だったのは、マスコミの論調・ネット上での色々な人の感想が今回の理研の次世代スーパーコンピュータプロジェクトへの評価を、民主党の科学技術に対する態度の現れ、要するに科学技術を重視しないということである、というようなものであったことです。

これまでに何度も書いた通り、このプロジェクトはこれまでに方針設定のミスを繰り返してきています。もっとも大きな問題なのは、開発プロジェクトでは必須な、適切な技術状況の理解を背景にした強力なリーダーを欠いていたことで、そのために開発実施本部が文部科学省内の評価委員会や総合科学技術会議内の評価 WG に振り回されたあげく、全ての関係者がみんな不幸な、中途半端な複合型でプロジェクトを始めることになったわけです。そのような推進体制・過去の経緯に対して文句がついた、ということは、現政権(財務省という話もありますが)が良く内情を理解し、正しい方向に向かうべく指導している、という面もあると思います。

まあ、そういう状況でもメーカーさんはあまりブレることなく着実に開発を続ける、というのは日本の「国家プロジェクト」と称するものではありがちなわけで、途中で一抜けたした N の内情は不明ですが、 F は着実に開発を進めてきています。

2012 年(2011年度末)の段階で 45nm で 128Gflops というのは Intel, AMD に比べると2年遅れくらいになるのは確かです。Intel は2010 の早い時期に 8 コアのNehalem-EX で 100Gflops 程度、AMD も同時期に 12 コア Magny-Cours でやはり 80 Gflops 程度までは到達しそうだからです。このことにより、価格性能比で x86 ベースのシステムに比べると2倍程度になると思われます。

しかし、重要なポイントは、それでも N, F の現行の、7大学の計算機センターや JAMSTEC, JAXA の納入されたシステム、つまり SX9 と FX1 に比べると飛躍的性能向上を実現するはずである、ということです。SX9 は一声、1チップ当りの価格が1千万で、100Gflops 程度の性能、メモリバンド幅は1チップ当り実力で 170GB/s 程度、FX1 は40Gflops で500万、メモリバンド幅は名目 40GB/s 実力 xxx なところです。これに対して、次世代スーパーコンピュータでは少なくとも 8万チップのシステムを建物までいれても 1200億で構築するわけで、チップ当りの調達コストが150万と FX1 の 1/3、建物が 1/2 とかいう話を信じるなら 1/6 まで下がり、演算性能は3倍、メモリバンド幅もいくらなんでも名目で2倍弱、実力では名目の 1/2 以上くらいは出るように作るでしょうから、演算性能で20倍近く、メモリバンド幅でも10倍近い向上です。かける時間は3年弱なので、ムーアの法則に従うなら4倍の性能向上がせいぜいのところを10倍、20倍といった目覚ましい性能向上になっているわけです。

言い方を変えると、価格性能比に関する限り現在は10倍近いギャップがあるのを2倍程度までつめる画期的な成果を、マネジメント側の迷走にもかかわらずメーカー側は実現しつつある、ということになります。まあ、チップ当りのシステムコストを 1/3 にどうやって引き下げたのかは私には良くわかってないので、額面通りに受け取っていいのかどうか？なところはありますが。

少し前に書いたように、現在の x86 ベースのシステムの優位は、 1-2 ソケットノード、つまりはデスクトップ用の安価なプロセッサが 4 ソケットノード以上用の高価なプロセッサと実質同じものであり、はるかによい価格性能比を実現してきていた、という歴史的な事情に相当程度まで依存しています。この、デスクトップ用プロセッサの優位、という状況は現在消滅しつつあります。サーバ用は 8-12 コアがロードマップに見えるのに、デスクトップは当面6コアに留まり、 GPU との1チップ化に向かうからです。GPU が統合されるならそっちで計算は？と思っても、主記憶バンド幅はないのでまあ N 体問題くらいしか使えません。

さらに、AMD の Bulldozer の開発方向が本当に報道されているようなものなら、 AMD は x86 CPU に関する限り HPC マーケットを放棄したに等しく、プロセッサアーキテクチャとしては P4 に比べてはるかに優れていたにもかかわらず SSE2 実行ユニットをもたないために HPC では売れなかった、P4 出現後の K7 の状況になることがあらかじめ約束されています。このことは、Intel のハイエンドサーバ向け x86 チップは高価なものに留まり、ソケット単価が現在のように安いものが2011年以降に構築可能かどうかは自明ではない、ということです。

おそらく、 Intel のこの状況に対する回答は Larrabee であり、それは NVIDIA の HPC マーケットへの夢が Fermi であるのと同様に失敗を運命付けられています。これらは(GPU として成功しなければ) HPC 以外にマーケットをもたないものであり、HPC マーケットはプロセッサへの巨額な投資を回収できるだけのマーケットサイズをもっていない以上、競争力をもつ価格でシステムを提供して利益を上げることは極めて困難だからです。

では、GPU としては成功するのか？というと、 GPU マーケット自体が統合チップセットやCPU との統合によって縮小、消滅しつつあり、そのこと自体が NVIDIA が HPC マーケットに夢を托す理由になっているのではないかと想像されます。これは 90年代前半に元々はグラフィックワークステーションメーカーであった SGI が HPC マーケットに追い込まれ、ついには Rackable Systems に吸収されたのと同じ運命を辿らざるを得ないでしょう。

というような様々な状況を考えると、値段設定さえなんとかなれば Venus はそんなに悪くなく、マーケットでも戦えないとも限らないのでは、と思います。ただ、そのためには自社の 45nm ラインでは量産能力・コストともに限界があり、早急に TSMC の 28nm 程度に移行する必要がありそうです。

Previous ToC Next