Previous ToC Next

47. nVidia 8800 を使ってみました(私ではないけど) その2 (2007/3/11)

ちょうど前回の記事を書いたころに、 PGR(FPGA のプログラム生成システム) をやっている濱田君から、 GPGPU で N体計算をやる 論文 の草稿が送られてきました。

実装の詳細は論文を読んでいただくとして、粒子数が 2048 程度と少ないところでも 150Gflops 以上と、かなり良い性能がでています。 GRAPE-6 だと 2048 粒子 では(計算コードにもよりますが、独立時間刻みとかのホスト計算量が多いコー ドの場合)20 から 30Gflops 程度しかでないので、独立時間刻みでないとか単 精度なので通信量が少ないとかいう違いがあるにしても 5 倍以上というのは 良い性能です。

まあ、これは GPU の演算性能というよりは PCI-Express の通信性能が見えて いるのですが、前回紹介したアムステルダム大学のグループの論文と違って、 まともな通信性能がでているわけです。演算方式が単精度だとか、そういう違 いもあるのでこのまま実用的な計算に使えるかどうかは検討の余地があります が、そうはいっても GRAPE-3 等に比べると高い精度があるので問題によって は十分です。

演算性能については、漸近的な速度が 256Gflops 程度まではいっており、 GRAPE-6 に比べるとすれば、 4 チップの PCI カードである GRAPE-6Af より は速く、 32 チップをのせたボード版よりは遅い、というところです。電力効 率は GRAPE-6 よりかなり悪いですが、値段は圧倒的に安くなっています。

とはいえ、値段が安くなると、相対的に電力コストが上がってきます。消費電 力がどれくらいで、それがどれくらいのコストになるかをちょっと見積もって みましょう。東京電力で普通の家庭用だと、1kWh 20円 くらいです。8800GTX のフル動作時の消費電力は 200W を超えるようで、1時間当り4円、1年間フル に動かすと 35000 円、5年使うと 17万5千円です。この 200W は変換損失等を 考慮していないので、実際の数字はもうちょっと高くなります。さらに、空調 のコストも入れると 1.3-1.5 倍になります。もちろん、業務用電力はこの半 分程度なので、GPU だけでは年 2万円程度ですが、色々考えると業務用でも年 4万円程度、2年も使うと電気代のほうが高い、という代物であることは要注意 です。 8800GTX の現在の価格は 8万円程度なので。

つまり、スーパーコンピューティング用、ということを考えると、現在の GPU はコストの大半を電力コストが占めかねなくなっています。ここまでハー ドウェアの値段が下がると、電気代のほうが大きくなるわけです。

将来とも GPU がこんな気違いじみた消費電力の設計をつづけるのかどうかは 不明ですが、性能競争を続けるなら電力はなかなか下がりません。汎用プロセッ サとの差をみてみると、 Intel Core 2 Extreme QX6700 は 2.66GHz クロック で単精度なら 85 Gflops の理論ピーク演算性能を持ち、消費電力が CPU だけ なら 130W です。8800 は演算性能の理論ピークで 6 倍、電力消費で 2倍といっ たところであり、電力効率では理論ピークで比べて3倍しか良くないわけで、 将来どうなるかは微妙なところになります。Xeon 5320 の低電力版だと 50W で 60Gflopsと計算上はなります。まあ、FB-DIMM なメモリが一杯電気を食う ので意味がある比較かどうかは難しいですが。

ちなみに、理論ピーク性能がほぼ同じ GRAPE-DR は、チップだけだと 65W 前 後で 8800GTX の3倍程度電力効率がよくなっています。どちらも TSMC 90nm プロセスなので、これは、チップサイズの差と動作クロックの差から見て妥当 な数字です。GRAPE-DR と 8800GTX で、動作クロックが 500MHz と 1.3GHz で 約3倍、チップサイズは 8800GTX のほうがやや大きいからです。

とはいえ、 GRAPE-DR の消費電力もちょっとなさけないほど大きいものです。 GRAPE-6 チップの電力消費は 15W 程度であり、その4倍以上になっているのに 性能は 15 倍くらいしかなく、プロセスが3世代違うわりには差が小さいから です。専用プロセッサとプログラム可能プロセッサの違いがあるとはいえ、 もうちょっとなんとかしたいところです。

と、話がそれました。本題は、 GRAPE でできるようなことをやらせるなら GPU は素晴らしい性能を出すことが実証された、ということです。ホストとの 通信は PCI-Express の性能が十分にでているとは思えないですが、まあそこ そこです。これが 10万円以下なのですから、 GRAPE も大変な時代になりまし た。濱田君は GPU のコードを GPL で公開する予定ということなので、広く使 われるようになると期待します。
Previous ToC Next