今年は ISC が7月になり、さらに Green 500 の発表は 8/1 まで遅れてどうなっ
ているんだろうかという感じがありましたが、無事に発表になり、
PEZY/Exascaler の Exsascaler システムが 1-3 位を独占という偉業をなしとげ
ました。関係者の皆様、おめでとうございます!
1位になった「菖蒲」は和光市の理研情報基盤センターに設置された
Exsascaler 1.4 システムで、7.03GF/W と初めて6 を超え、さらに7も
超える素晴らしい値です。これは、前回の 2014/11 には2位だった
KEK に設置された Exsascaler 1.0 「睡蓮」の 4.95GF/W から大幅な向上です
が、同システムは今回 6.22 GF/W に到達しており、今回の性能向上の多くは
システムやソフトウェアのチューニングによるものであることがわかります。
1.4 では、私が憶えている限り以下のような変更が施されています。
-
CPU を Xeon E5v2 から E5v3 にしてホスト側の性能向上・低消費電力化
-
カスタムのマザーボードを起こし、マザーボードに PEZY-SC モジュールボードを直接搭載することで、体積が小さく、また PCIe ブリッジがない低消費電力システムを構成。また高密度化を実現
-
PEZY 側メモリを DDR3 から DDR4 に変更することで省電力・高速化
また、HPL ソフトウェアはさらに色々なチューニングが施されています。かな
り大きな効果があったと思われるのは、行列をPEZY 側のオンボードメモリと
ホストメモリの両方に置き、なるべくPEZY 側においたままにすることで行列
サイズを大きくし、通信を減らし、効率を上げるとともに省電力化するという
ものです。私の知る限りこのような実装は世界初です。
現状では2位のシステムは前回1位だった AMD FirePro S9150 + Xeon E5v2 の
システムなので、どこかが AMD FirePro S9150 + Xeon E5v3 のシステムを構
築し、十分なチューニングを施すことができれば今回の1位を上回る可能性も
ありますが、 Top500 の中に2システムしかない AMD GPU のシステムが増える
というのも、純粋に Green 500 だけを目標のするのでなければありそうにな
い話です。そうすると、 NVIDIA Pascal ベースのシステムがでてくると思わ
れる来年秋までは PEZY は世界一を維持できそうです。 Pascal もどの程度
の倍精度性能なのか?な面もあり、Green500 については KNL のスタンドアロー
ンシステムや、"China Accelerator" Matrix2000 GPDSP のほうが上にこない
とも限りません。
なお、PEZY-SC の電力性能はまだ余裕というか改善の余地はあり、現在の測定
ルールで 8-9 GF/W あたりまではいけるのではないかと思います。が、これは
KNL や PASCAL ベースのシステムもこの辺かなあというところです。なので、
一層の努力を続けることで、来年秋以降も 1 位を維持できるかもしれないで
すが、ちょっと厳しいかもしれません。もちろん、相手は
Intel の 14nm FinFET や TSMC の 16FF+ プロセスで、現行の PEZY-SCは
28HPM なので 2.5 世代程度(TSMC は一応 16FF というものがあったので)の世
代差があり、それにもかかわらず同等の性能が予想される、ということが
PEZY-SC の設計の優秀性を示していることはいうまでもありません。
個人的には、Green 500 のトップは達成したので、次は実際のアプリケー
ションでの有効性の証明、次世代プロセッサの開発、商業ベースでの設置
といったところ、特に、アプリケーションの移植・性能向上に注力する
ことを期待したいところです。これは単に自分達で使いたいからというのが第一の理由で
はありますが、これは言い換えると実際にアプリケーションが動くことが、使
う側から(と、買う側)見れば第一に重要だからということでもあります。
アプリケーションの性能向上は、アプリケーションコードだけの話ではなくド
ライバソフトウェアの改善、例えばホストとのデータ転送の高速化、カーネル
起動のオーバーヘッド削減、データ転送とカーネル実行の並行処理や、
コンパイラ自体の改善、ユーザー側への最適化手段の提供、ドキュメント整備
と無限に沢山やることがあり、これを全て社内リソースで、というのは
20人程度の小企業ではなかなか大変とは思います。が、ソフトウェアを肥大化さ
せるのではなく単純な構造をとることでオーバーヘッドを削減できるというこ
ともあるので、小規模なグループだからできるやり方、というものもあると思
います。