16. HPL 書き直しその5 (2009/10/3 書きかけ)
ここでは、前の節の議論から、 HPL にちょっとだけ手をいれて速くする、と
いう方針を検討します。
まず、普通にやると
が並行してむ必要がある、というふうに書きましたが、良く考えるともうちょっ
と簡単にできます。我々の方法では、 DTRSM を DGEMM で置き換えます。つま
り、行交換と放送でできた U に、対角部分の逆行列 を左から掛け
て、それと左から放送されてきた Lを掛ける、つまり、 とい
う計算をするわけです。行列乗算には結合則がなりたつので、これは
<($L(P^{-1})U$> という順序でやる、つまり、 L と を先に掛けて
もよいわけです。この場合は DTRSM はここでしなくてもよいので、話がだい
ぶ簡単になります。