つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2010/06 2010/05 2010/04 2010/03 2010/02 2010/01当面の予定
しかし、この発表資料のスライド 24 の Istanbul 8 ソケット 48 コアの数字、 明らかになんかおかしいよな、、、 Istanbul でピークの 1/3 以下なんて ことがあるはずがない。
i = *((long long *)(&f));みたいなことをすればよさそうなわけだが、これは実は、、、これが×になっ ていいってのは、言語仕様のどっかに書いてあるのかしら?
The Grape-DR supercomputer, which in addition to be the greenest is apparently also the messiest, ...
「京」は価格性能比としては、世界からというかアメリカから5年くらい遅れていたの を 1-2 年のところまでつめた結構素晴らしい機械ではあるんだけど、まあ、 でも、やっぱり 1-2 年遅れで、追い越しているものではない。技術レベルと してそういうところにあるものに、お金を一杯いれて無理矢理に世界一を目指 す、というのは(何度も書いたけど)あまり賢い方策ではなくて、本当は 追い越して先に進むために投資しないといけない。でも、まあ、追い越す ためにはアメリカでまだやってないことをしないといけないのに、 そういう提案しても採用されない、というのが日本の、これは まあ学問風土の問題なのかなあ。
別に GRAPE-DR のことだけではなくて、 例えば こういうのの話。
Kanter 氏の結論の要点は,CPU版のPhysXは浮動小数点の計算に昔々のx87浮動小数点演算を使っており,SSEの並列演算も複数コアを利用したマルチスレッドも使っていないので,CPU版PhysXは性能が低いというものです。ここまでやって 2-4倍ということは、普通に SSE 使ってマルチスレッドにし たら CPU のほうがほぼ確実に速いということでは?理論演算性能では数十倍 違うわけで。
1946 ENIAC 150KW 14flops 0.00009flops/W (乗算の速度) 1976 Cray-1 115KW 160Mflops 0.72kflops/W 1995 GRAPE-4 20KW 1Tflops 50Mflops/W 1997 ASCI Red 850KW 1.7Tflops 2Mflops/W 2002 GRAPE-6 50KW 64Tflops 1.3Gflops/W 2011? BG/Q 6MW? 20Pflops? 3.3Gflops/W 2012 理研次世代 30MW? 10Pflops? 333Mflops/W本当は GRAPE-4 とか6程度に汎用機より良くないといかんよね、、、もちろん、 汎用化した分トランジスタ効率悪いんだけど、それと同じくらい汎用機も落ち てるし。
というのはともかく、電力当り性能は Cray-1 から ASCI Red までの20年間で 3000倍、それから BG/Q までの15年間で(BG/Q が目標通りできたとして、、、 これ結構困難な目標だけど) 1000倍ちょっと。 理研次世代は空調も含んだ数字 だと思うので計算機だけではこの半分の 15MW だとしても 300倍で、計算機の 性能の上昇率よりもかなり小さい。10年で 3-5倍のずれ。つまり、実は過去 40年間にわたって計算機の価格当りの電力消費は10年で 3ー5倍のペースでほぼ 指数関数的に上がっている。で、それまでの30年間はそうではなかった。
GRAPE-DRは既に失敗プロジェクトとして結論が出ており、いや、あなたの頭の中の結論はそうなんだと思うけど。
時期的にも、高性能GPGPUがいくつも市販されている現在では、存在価値を見出すことが難しいガラパゴス・ボードである。いや、だから、その、最新の高性能GPGPUに比べてずっと高い電力当り性能を出しま した、という話なわけだ。この辺、数字を書くと嘘がばれるから書いてないの かな?理論ピークでは、 GRAPE-DR は倍精度で大体 4Gflops/W、Fermi は実際の消 費電力が不明(TDP として書いてある値より高いといわれている?)ですが、 515Gflops/247W という数字を信じれば 2Gflops/W で倍違うわけで。で、HPL での数字はどっちも今のところこの理論ピークの 1/4 程度。これは、大雑把 にいってホストが半分電気を食って、あと実行効率が 50% だから。
一般的には、Small Systemの方が断然有利と考えられるからである。これは一見もっともらしく聞こえるんだけど、実際の数字を見るとそうでもな くて、Little List の 20位までの中に、Top 500 の 10 位までのシステムは3 つも入っている。これらは Fermi, HD4870, PowerCell のシステムで、システ ムサイズよりプロセッサが何であるか、つまりは1ノードの電力性能のほうがはるか に重要な要因になってるわけ。同じ PowerCell で QPACE が他より良いのは システムが小さいからではなくて周辺で電気を喰わない設計になってるから (なので、小規模なシステムでも QS22 ではQPACE より悪い)。
もうちょっと定量的な話をすると、システムサイズが大きくなって変わること はインフィニバンドスイッチの段数くらいなわけで、6000ノードくらいまでは 3段でいけるので2段か3段かの違い。これは、ノード当りの電力を10-20ワット くらい変える。ほとんどのシステムはノード当り 400W 以上なので、これはつ まり、最大5% 程度の影響がある、ということ。もちろん、Cray や QPACE の ようなトーラスの場合はこのような増加はない。この、最大で5% の違いをもっ て、
一般的には、Small Systemの方が断然有利と考えられるからである。というのはまあどんなものかなあと思う。まあ、その辺の問題があるので 実は Green 500 はネットワークの消費電力はぬいた数字を出してもいい ことになっている。
で、この第2の点の本質は、こうした背景説明なしで、「世界一」「世界一」と騒ぐ発表者の「小賢しさ」と、その発表を無批判に受け入れ、「オオム返し」に報道する、メディアの「低能さ」、「低劣さ」なのである。いやいや、これが朝日新聞くらいだと、(ちゃんと記者さんは良く中身がわかっ た上で)、きっちり見出しが
日本のスパコン、省エネ世界一 市販PC部品を駆使記事本文でも
市販のパソコン部品も多用してと書いてあって、我々が独自プロセッサを開発した、ということは上の「も」 にしか表現しない、という記事にしてくれてるわけで、「無批判」でも「オオ ム返し」(「オオム」は原文のまま)でもないし。まあ、目が曇っていると 他の人が低能に見える、というのは良くあることではある。
消費電力の増加は概ねクロック増加率の2乗と考えられるそれは、電圧も比例させて増加させた時の話だってのは知っていて無視した のか、知らないのかどっちなんだろう?こういう算数がなりたつなら予定のク ロックで動いてない Fermi だって素晴らしく消費電力がさがっていそうなも のである。
要するに、意図して世界一の省電力設計技術を実現したなどというのは、作り話も甚だしく、たまたま偶然そーなった程度の、「いい加減なもの」でしかないのである。これは考えて見るとものすごい誉め言葉で、我々は「たまたま偶然」世界一の 省電力を実現できるような設計をしていたわけだ。
まあ、大規模なシステムで HPL とかの良い数字をまだ出せてない、というのは 事実なので、そこを取りあげて悪口をいうのはまあ良いんだけど、それがいい たいために技術的な内容についてデタラメをたれ流すのは、、、まあ、この人 はそういう、技術的なことがなにもわからないか、またはわかっていて嘘を書 く人だ、ということ。
ついでにいうと、もちろん、小規模なシステムで高い効率を出すのは、 大規模なシステムで高い効率を出すために必要なステップなわけで、 今回の数字(世界一がどうではなくて、実行効率ほぼ 50% を実現できたこと) は、その意味で我々にとっては重要なことだった。単一ノードで 50% を 去年の暮れに実現して、64ノードで同程度の効率を今回実現できたので。
63 :不明なデバイスさん:2010/07/08(木) 09:54:16 ID:PibubPXF 64 :不明なデバイスさん:2010/07/08(木) 10:03:11 ID:PibubPXF 65 :不明なデバイスさん:2010/07/08(木) 10:15:25 ID:PibubPXF 66 :不明なデバイスさん:2010/07/08(木) 10:19:13 ID:PibubPXF
Grape-DRがスパコンの省エネを競うGreen500の小規模システム用サブリストのLittle Green500の一位に。サブリストではなくて、拡張したリストだけど、松岡君なんだからちゃんとそのへんわかってて書い てるんだよね。まあ、 11 月には狭いほうのリストにも載せます。
Listed below are the Little Green500's Top 10 most energy-efficient supercomputers in the world as of June 2010.
Green500 Rank MFLOPS/W Site* Computer* Total Power (kW) 1 815.43 National Astronomical Observatory of Japan GRAPE-DR accelerator Cluster, Infiniband 28.672 2 773.38 Forschungszentrum Juelich (FZJ) QPACE SFB TR Cluster, PowerXCell 8i, 3.2 GHz, 3D-Torus 57.54 2 773.38 Universitaet Regensburg QPACE SFB TR Cluster, PowerXCell 8i, 3.2 GHz, 3D-Torus 57.54 2 773.38 Universitaet Wuppertal QPACE SFB TR Cluster, PowerXCell 8i, 3.2 GHz, 3D-Torus 57.54 5 536.24 Interdisciplinary Centre for Mathematical and Computational Modelling, University of Warsaw BladeCenter QS22 Cluster, PowerXCell 8i 4.0 Ghz, Infiniband 34.63 6 530.33 Repsol YPF BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz, Infiniband 26.38 6 530.33 Repsol YPF BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz, Infiniband 26.38 6 530.33 Repsol YPF BladeCenter QS22 Cluster, PowerXCell 8i 3.2 Ghz, Infiniband 26.38 9 492.64 National Supercomputing Centre in Shenzhen (NSCS) Dawning Nebulae, TC3600 blade CB60-G2 cluster, Intel Xeon 5650/ nVidia C2050, Infiniband 2580 10 458.33 DOE/NNSA/LANL BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, Infiniband 276 10 458.33 DOE/NNSA/LANL BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, Infiniband 138 10 458.33 IBM Poughkeepsie Benchmarking Center BladeCenter QS22/LS21 Cluster, PowerXCell 8i 3.2 Ghz / Opteron DC 1.8 GHz, Infiniband 138 - しかし、最近の x86 の電力性能の改善は世代毎に 1.6 倍しかないんだ、、、 10年間で7世代として、30倍も上がらない計算。AVX とかしないとどうしようもないのも わかる。
2010/7/3
- まだ Feng 先生とメイルでやりとり中。色々御面倒おかけしてすみません、みたいな。で も、そちらの Web submission のシステムが適当なせいだと思います。はい。 データの確認とかできないんだもん。
- メモリ24GB まで増やせれば 1Gflops/W いけるんだけど、そんなお金な いな 、、、 現在性能リミットしている最大の要因はホスト側の DGEMM だか ら、CPU のコア数かクロックあげるのでもいいんだけどi7 は相変わらず高いし。 Phenom II X6 で12GB でどこまであが るかな?こっちなら今年度予算で買える。
- Gree500 サイト、 directory listing を受け付ける設定になってる。今見ると結構アレなものがある。折角なので一昨日時点のデータを保存。
2010/7/2
- 午前セミナーは松井君、加瀬君。
- お、、、返事がきたぞ。まあ、色々アナウンスしちゃったあとに一位の 数字を入れ替えたくはないだろうとは思うが、どうするのかな?どうやって 2倍になったんだ?と聞いてきたので、あれやこれやを色々いじって、、、 という感じのお返事をする。
- 2010/7/2 17 SAT
T社の噂話とか。まあ、その、N***** がどうとかという話から新しい何かがあるわけではないんだけど。- Green 500 Little List "June 2010 Down for temporary maintenance" きた。
- 野田さんのこれ、問題はこういう、海外で偉い先生が同じことをいいだすまで日本では無視される、という文化なんだよね、、、
2010/7/1
th visit since Apr 1st, 1999.
- 1245157
- Green 500、数字が更新されてないので問い合わせ中。うーん。
- 今日(先月末ではなくて今日だった)〆切の原稿を送る。
- しばらく放置していたレフェリーへのお返事案を直しはじめたが途中で 力つきた。