つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2022/04 2022/03 2022/02 2022/01 もっと昔「ホストは、参加者自身のミュートを解除することを、参加者に許可していません」
と思ってたら終わり頃にお客様が。
皆様お疲れさまでした。ご参加ありがとうございます。
そうすると、MI250X 37,632個で名目ピークFP64で1.686EFだからカード1 枚45TFしかない。AMD のホワイトペーパーの 95.7TFの半分。いつのまにか性能が半分になった?
FP16 はその4倍だと6.7EFで HPL-AIの数字にいかないので多分その倍あると。まあ11月の段階でなんかFP64名目の数字になってない雰囲気があったのとあまりにバランスおかしいので変えてたのかもだけど、他は同じでFP64だけ半分ってどういうことみたいな、、、
N6 であんなでかいダイ2個も並べて FP64/FP16 45/360TFだとちょっと商売厳しいんじゃないかしら?FP16でA100に勝ってない、、、
あー、でも、 50GF/W 実現のためだけにすごくクロックと電圧落としてる可能性はあるのか。でもカードレベルで90GF/W として500W喰うわけで、それが例えば 70GF/W まで落ちて 90TFいったら 1KW超えるしちょっとありそうにない。
引用: 若い患者の方は多いです。当院の患者さんでも、2、30代が多くいます。そしてかなりの確率で寝たきり状態に追い込まれ、仕事を失うという現実があります。若いから大丈夫なんてことは一切ないということが言えます。
MI250X は N6 で、ホストも EPYC だからさすがにホストが Xeon Platinum 8260M で製造プロセス N12の現行MN-Core では厳しい。
とはいえ Green の数字は10年で25倍と。結構上がったけど100倍にはだい ぶ足りないのとここ5年の上昇が少ない。4倍ちょっと。
ポスト富岳が2030年として、まあ 1TF/W が目標なんだけど半導体技術的にどうだろう?という話か。
1990: 1μm, 2000: 180nm, 2010: 40nm, 2020: 7nm で10年で大体 1/5。
半導体スケーリング(電圧下げるのもいれて)でまだ4倍くらいはいくとすれば回路構成で5倍。まあ原理的にはまだいけるかもくらい。
この特集では石山さん、堀田さん。さらに JWST の話で大栗さんで千葉率が高い。大栗さんは花輪さんの後任?教授就任おめでとうございます。
実は巽さんの連載もあるので神戸率はもうちょっと高い。
あと河東さんの連載が始まってて数学者の思案1「頭の良さと数学研究」。君がそれ書くかね感が、、、
で、100g じゃなくて200gだった。これならまあ。
あと、太陽電池は有機薄膜とかペロブスカイトとかの実用化がみえてきてて、シリコンが駄目というわけじゃないけどみたいなところが、、、
引用:専門家の指摘を受けた厚労省は、突如データを修正。その結果、ワクチンを打っていない人の新規陽性者数が大幅に激減しました。この「結果」が示すこととは・・・?
引用: (名古屋大学・小島勢二名誉教授) 「海外の報告を見ると、オミクロン株にはワクチンの予防効果がかなり減ってしまったという話が1月の時点であった。ところが厚労省が出しているデータを見ると、(予防効果が)すごくいいんですね。
引用:海外は(予防効果が)20%になったというのに、日本では最初の治験のデータと同じで、まだ90%あった。これはおかしいな、日本人は特別かなと」
引用:小島名誉教授が国会議員を通じて、このことを厚労省に指摘すると… (名古屋大学・小島勢二名誉教授) 「4月11日からは(未接種者と2回目接種済みでは)感染予防効果が変わらないという結果に(修正された)」 厚労省が突如、データを修正。
これもちろんわかっててごまかしてたわけだよね、、、報道したのは偉いけど厚労省の「理由は不明だが意図的なものではない」というふざけた主張を受け入れてはいかんだろう。
しかしこれ気が付いて指摘した名古屋大学・小島勢二名誉教授すごく偉い。
36コア Xeon より2倍くらい速い。1スレッドだと2倍遅いんだけどね。
これは for(i=0;i<n;i++)a[i]=b[index[i]]; みたいな並べかえを大きな 配列でやるところが律速で、プリフェッチとかちゃんとだすと A64fx は HBM の威力でSkylake の4倍くらい速い。
ソフトウェアプリフェッチがすごく有効、というのはこれもつまり OoO資源が足りないからだよね、、、
次のセッションは座長である。
「粒子」を時間ステップ毎に作る方法。
座長終了。なんか参加者おおかった気が。皆様ありがとうございます。
成果創出加速プログラムの予算が少なすぎる、人材育成に投資されていない、1課題が小さいのは弊害が多い、長期計画がないのは問題、とまあ真っ当なことが書いてある。
富岳運用についてはコンパイラの改良を継続する必要、ストレージの不足 等。
ポスト富岳については、、、結局どうしろというのかよくわからない。
ポスターとショートプレゼンテーション作ったというか内部セミナーのスライドそのまま、、、
今回の e-poster は画像 100枚までとかなので単にスライドあげるのが一 番簡単な気が。jpeg とかだけで複数ページのPDFとかは受け付けない模様なの で pdftoppm -r 300 -jpeg で変換。
その辺の短い解説は こちら
正確にいうと、死亡数予測の上限からの超過数と死亡数予測そのものから の超過数で、下限からの予測ははいってない。なので 6万は予測区間の端じゃなくて中央みたいなもの。なぜそういう普通じゃない見せかたをするとかは謎、、、でもないけど。
議員さんはむしろそういう教育の被害者であって、被害者を非難してもなあみたいな。
ただまあそういう観点にしちゃうと、じゃあそもそも全人類にとって××は学ぶべきかみたいな。
でもまあ、高校での数学とか理科って、そこまでで完結した体系というより大学で学ぶべき体系の準備ということで、大学では扱う概念を色々ぬいたものを無理矢理教えてるところがあって教わるほうから見ると色々不可解じゃないかしら?
で、説明の時間終わってもう一度接続したら何事もなかったようにちゃんと認識した。あれれ?
まあそういうものではある。
Linux どうしたっけ?
引用: Our initial parameterization corresponds to a signal configuration that is constant in time and shows a Gaussian shape centred in the field of view with s.d. of 30 μas.
これはつまりそういうことな気が。
非常に雑にいうと、EHTC の M87 の観測データを独立に再解析したら、彼 らの結果のようなリング構造は見えなくて、コア領域は明るい点源2つに分解 された、というもの。
ほんまかいな?EHTC は独立に3種類の方法でイメージングしてみんな同じ結果になったし、そっちがあってるに決まってる、こいつらなんか間違えてんじゃねーの、と思うのは当然である。
もちろん私も三好さんから初めてこの話聞いた時ににはそう思ったし。S269の件もあって三好さんがいうことが本当かもしれないけど、、、みたいな。
というわけで、なぜ EHTC はリング像を得て、我々は得てないか、どっち が本当か、というのを5節で延々議論している。まず、図18に示されているよ うに u-v カバレージが悪く、特に 42 uas 付近はどの方向もサンプルされて ない。
このため、図19に示すように、 dirty beam にはそれくらいのサイズの4 辺形が並ぶ感じになり、それをそのままイメージモデルにすると図20にあるよ うにリングを作ることができる。
もちろん、EHTC の解析はそういう単純なものではないが、我々の AIPS IMAGR を使ったイメージングでも、BOX 領域(そこにソースがあると信じる領 域)を直径60uasの円にすると EHTC のと同様なリング的な構造になる(図30)
EHTC は色々な方法でイメージングしているけど、どれも直径60uasの円内 にソースがあると実効的に仮定している。
というわけで、本当にリングがある可能性もあるけど、EHTCのはリングがなくても リングがでてくるようなイメージングになっちゃってると思われる。
なので、我々のイメージングのほうが本当かもしれない。というような感じ。
トランジスタ数倍近いなら N1 のままで単純にコア数2倍のほうがよくないかみたいな。まあコア当り性能あげたほうが他のプロセッサとの比較で格好はいいんだろうけど。
で、SVE 256ビットか、、、まあOoOリソースがどれくらいでどんな効率がでるかとかには興味はある。
しかし、普通のワークロードに対して x86 に比べて電力性能(と、多分チップ面積あたり性能=価格性能比でも)かなりよさそうではある。商用ソフトウェアはこっちに対応も考えてくのかな。
NVIDIA Grace に比べて Graviton3 のほうが同じくらいのコア当り性能で電力消費はずっと少ないみたいだけど、そうなの?
記者クラブのシステムが自己検閲と外国人記者やフリーランスへのあからさまな差別を起こしている。
政府と企業は日常的にメディアに圧力をかけていて、これが汚職、セクハラ、新型コロナ、被曝、汚染といったセンシティブな問題に関する自己検閲につながっている。2020年に政府はコロナを理由にして記者会見に呼ぶ記者の人数を制限し、NHKのキャスターを国家的危機の時に指示に従うべき組織のリストにいれた。
SNS では、政府に対して批判な、あるいは福島原発の事故による健康問題、沖縄の在日米軍、日本の戦争犯罪といった「非愛国的」テーマを扱うジャーナリストは国家主義者のグループによって日常的に攻撃される。
といったことが書いてある。なかなか適切な評価ではある。しかしNHKの報道では「大企業」以外全部落ちる。記者クラブとか政府の圧力とか。つまりこれがNHKによる自己検閲であると。
まあ要するにそうでないとちょっと遅いんだけど。
富岳で富士通コンパイラで parallel stl が使えるのはいつごろかなあ、、、
ノード内並列ソートって、キャッシュにはいらなければ完全に主記憶バンド幅リミットになるので、とにかく主記憶アクセスを減らすのが最重要になる。
今のコードは一旦新しい配列で並べ変えてから元の配列に書き戻してて、 まあ書き戻しは完全に連続アクセスで速いけどでも無駄ではある。富岳だと それよりソート自体が遅いけど、 Xeon だと最後の並べかえが遅い。まあだか ら parallel stl より速くなるんだけど。
一応、固定サイズの構造体をソートする、ソートキーはその構造体を引数にする関数の返り値でそれに比較演算子を定義できる、という条件の下ではかなり速いほうじゃないかな?マルチコアでわりと飽和しないようになってる。
ソートの高速化の論文色々なあるんだけど、32ビット整数をソートしますみたいなのが多くて、構造体ソートに実際に使えるライブラリって意外にない気がする。
コア間並列化はサンプルソートで、コア内もトップレベルはサンプルソー トでL1/L2 にはいるくらいのブロックに分けて、あとは std::sort か AVX512/SVE使ったソートに切り替える。
AVX512/SVE 使ったソートは最初はクィックソートで最後はバイトニックにする。