つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2022/02 2022/01 2021/12 2021/11 2021/10 2021/09 2021/08 2021/07 2021/06 2021/05 2021/04 2021/03 2021/02 2021/01 もっと昔平尾元機構長、米澤、宇川元副機構長を始めとするAICS/R-CCSの同僚の皆 様、また特に事務の皆様には大変お世話になりました。R-CSS の一層の御発展を。
みたいな。
どっちの数字でもほとんど減ってない。
生成した SVE の16要素bitonic sorterのコード。 Arm SVE のイントリンシックは Intel のと違って簡潔で読むのも書くのも楽ではある。
とはいえ、bitonic sort とかだと SVE のレジスタ長が実行時まできまらないという機能は単に邪魔である。並べかえの定数テーブルがレジスタサイズによるしそもそもレジスタ内か外かで全然違うコードになるから。
SVE で無駄の多いコードでも std::sort からの改善が大きいということはどういうことかというと、、、みたいなね、、、
明らかに修正すべき点。別のステップで同じ変換テーブルを使い回せる時 でも新しいの生成して実際にロード命令がでているので、これは無駄。あと SEL 命令のためのマスク(predicate)も今は毎回 CMPNE 命令で作っていて、こ れもなんとかしたい。
でも、SVEってマスク(svbool) 型の変数をメモリ上にもてないよね?gcc 11 だと -msve-vector-bits=512 のオプション受け付けるけど、だからといっ て sve 型の変数サイズをコンパイル時に既知としてくれるわけでもない。
mask だとあるんだよね。まあマスクなければ型毎の load/store 不要だからなくていいんだけど。
生成した16要素bitonic sorterのコード。 AVX512のイントリンシックはAVX2ほど不可解ではない。_mm512_permutex2var_epi64 と _mm512_min_epi64 (max) がひたすら並ぶだけ。
しかし AVX2 のイントリンシックってなんかとる型がおかしい気が、、、
FDPS で当面必要なのは SVE で128ビット整数のキーと値64ビットとかなんだよな、、、
AVX2 での8要素bitonic sort のコード write-only コードである。
AVX512 だと VPERMI2Q(_mm512_permutex2var_epi64)で2ワードから任意の 要素を選べるのでこんなことしなくていいんだけど、SVEだと、、、まあTBL 4 回と SEL 2回でできるか。
引用:会議資料によると、都内の1週間平均の感染者数は23日時点で6123人と、前週の8093人の76%となり、減少傾向が続いている。
引用:ただ、東京都健康安全研究センターによるオミクロン株のPCR検査では、14日までの1週間でBA.2の「疑い例」が38・5%となり、前週の17・8%より約20ポイント上昇していた。
単純に考えるとBA,2 以外が6650人から3770人に減ったのに対して BA.2 は1440人から2360人で大体1.5倍、これを来週に外挿すると BA.2 以外 2140 人、BA.2 3860人、合計6000人で総数ほぼ変化なし、再来週は 8400人、その次は1万を大きく超えるかも。
アメリカが全体で BA.2 が 35% (2022/3/19) でほぼ同じような感じ。
クィックソートのSIMD化なので、SIMDワードの中でピボットと比較してフ ラグがたったところを数えるとか左(か右)につめる操作をする必要があるんだ けど、AVX2ではそれに特化した命令はないっぽかったので _mm256_permutevar8x32_ps を使っている。
そのためにフラグのビット列から行き先に変換するテーブルを作ってある。
ところが、SVE には「フラグがたってる要素を左につめる」COMPACT 命令があって、 svcompact で使えるのでテーブルロードとか不要で命令数が減る。
こんな命令があるのに気が付かなかったがもちろんドキュメントには書い てある。まあ Cyber 205 にあった命令なので、 VP の命令セットを通して SVE にはいってても不思議ではない。
SVE は明示的にマスクレジスタをロード/ストアする命令はないっぽいんだけど、まあ大抵のことは読み出さなくてもできるからか。
あ、AVX512 では _mm512_mask_compressstoreu_pd 使えばいいのか。あ と AVX512 でも svwhilelt みたいなマスク生成ができれば後始末なくせるはずである。
まあ色々話が流れてきてはいたが。
大きな研究所の長って、なによりまず研究者として圧倒的な実績がないと上手く回らないところがあって、まあ、色々難しい。
マスクは整数と同じように扱えるので残りの回転数がわかれば (__mmask8) (( 1< < nremain)-1); みたいな感じで生成できる。これを使った終了処理にしたらそれなりに改善した。
これは結局この20年くらい(まあ2014年までかもだけど)文科省が新しい話はなんでもかんでも理研でセンター作ってセンター長から任期付きで、でやってきたことのツケが回ってきたという話である。
大学付置研や共同利用研で(WPIみたいなわけのわからないものではなくて)ちゃんと進めててれば、それはそれで問題はあるにしてもこんなデタラメなことにはならなかったのではという気はする。
文科省の政策は大学をより今の理研みたいいにしようというもので、研究基盤を破壊しているわけだが。
まあもうメモリアクセスもレジスタファイルアクセスもゼロに近づけるくらいのなにかが必要なわけだが、、、
3回目進んだらなんとかなるはずと期待していたのかもしれないけど、ヨーロッパは3回目も概ね飽和でこれ以上進まない。ちなみに韓国は60%こえてて3回目日本より進んでいるが、最近世界トップくらいまでに感染拡大した。
日本はそこまでいってないのは、半分くらいはちゃんと数えてないせいだと思うけどあと半分はみんなががんばって接触機会減らしてるということなんだろうか?
国のメッセージはミクロには皆様頑張って、マクロには経済活動 等再開して、で矛盾してて、まあ、皆様頑張るしかないような。
まあもちろん原発再稼働やはては増設までいまだに諦めてない経産省の方針の問題ということはある。でもまあできたはずの省エネができてないというのも大きい。
読んでくとやっぱり途中で空間2次にしかできそうにない近似いれてるのでまあそういうものなんだろう。
が、確かにループ内の命令数は大きく減ったんだけど実行時間は25%くらい増えた。なぜ増えるんだと思って実行プロファイルとってみたら、単純に再帰で関数が呼ばれる回数が2倍くらい違っていた。
標準的なクィックソートアルゴリズムは、配列を(例えば)ピボットより大きい部分と大きくない部分の2つに分ける。で、それぞれに再帰掛ける。
私が書いたのは、比較とpermute 2回使って大きい部分と小さい部分に分ける。等しいところは無視して、最後に空いたところをピボットの値で埋める。
そうすると、ランダム入力で配列サイズにあんまり依存しないで再帰呼び出しの回数が半分になって、結果として演算は増えてるけど2割くらい速くなると。
配列サイズがものすごく大きいと理論的には普通のやつが速いはずなんだけど、100万くらいでは現在の実装のが速い。
なんかでもこれ最適かというとそうじゃない気がする。L1にはいるように ループ分割しないといけないけど、比較とpopcount を先にやって、 prefix sum で格納場所決めて、としたほうが速くならないかしら?
これはそもそも国立大学が高い授業料をとってるのがおかしいという話である。国立大学も民間企業並みに収益あげなさいという論理を内面化しちゃってる感じ。
Vico-Greengard-Ferrando では 4Lサイズの領域でカットオフがあるグリー ン関数を使ってそれをFFT でなんかうまいことして2Lサイズにする(ここ私よく わかってない)。
これは、グリーン関数が球対称で、長さ(直径)が2√3L必要だから。球対称なのは 解析的な形が欲しいからかな?
FMM/PMMM との組合せで考えると、セルに分けて離散化したものについて グリーン関数考えればよくて、数値的に求めるなら1辺2L の立方体でいいはず?
で、多重極展開を球面上の質量分布(sperical design でも使って)、 局所展開を球面上のポテンシャルで表現すれば、グリーン関数は単に疑似粒子の作るポテンシャルそのものになる。
疑似粒子には計算量的にはメリットないんだけど、SIMD化しやすいとかそういうメリットは多分ある。あと M2L に難しい数学がいらないのがメリット。M2M も割と自明。L2Lはポテンシャ ル場からポテンシャル場へだけどこれもグリーン関数があればいいはずか。この部分は周期境界でも同じ。
もうちょっとちゃんと考えないと上手くいくかどうかよくわからん。
もうひとつそういえば、学位取り消しになった宮崎氏の学位論文は宮崎・早野論文でこれは早野さん本人が自分で書いたことを認めてますね。人に書かせるのは諭旨解雇だけど自分で(しかも存在しないデータから)書くのはいい、というのが東大なのかな。
既知の不具合な気がする、、、
8.4 文字コード にあるなんでも UTF-8 にする設定もいれてみた。
どっちの数字でも減りかたが少ない。
Taiji Laboratory 0.01Hz あたりで 1e-21 が計画とのこと。
高額無申告でもチュートリアル徳井義実と茂木健一郎が刑事告発されなかった意外な理由
引用:「個人に支払われる報酬は法定調書として、報酬額と源泉徴収税額が税務署に報告されるため、確定申告を免れることはできません。ただ、税務署は法定調書で無申告の状態を把握できているので、金額が大きくても申告を免れる意図はないと判断されるのです」
それならそっちで計算してくれよという気はする、、、
こういう本もあると 実録 脱税の手口。あ、、、
とはいえ増えているかというと増えていそうである。
まあ Sunway を見ると Cell の欠点が随分直ってるわけで、そういうふうでなかったのが悪いという話ではあるかも。
音速抑制法的なことを考えるなら、建物は柔らかいとするわけだけど、共鳴が問題。高次の振動モードは頭から抑えるとすれば、、、
あ、正確には spherical design じゃなくて Lebedev quadrature。こっ ちは equal weight じゃないとのこと。置き方も正8面体ベースみたい。
今時なら数万点とかでも最高次までの直交性を満たすような配置を数値的に近似的に求めるとかもできそうだけど、
というのがなかなか解明できなくてこんな時間に、、、
Slack に金払うよりよくない?
全てに渡って田村智子議員の主張が大変もっともとしかいいようがない。日本の研究力低下の主たる要因は独法化と選択と集中による基盤研究費の削減と任期付きポストの増加であると。
まあこれは私が「大学の理研化」といってきたところ。トップに権限を集中させること、組織自体がプロジェクト予算で年限があり、任期なし研究スタッフが極端に少ないこと等。
で、理研の600人問題、つまり来年度末で600人が10年任期がくる話もとりあげられる。
まあでは30年前の大学みたいなのがいいかというと、研究しているかどう かわからない人が一杯いたり新しい分野に取り組む人が少なかったり無駄が多 かったじゃないかという人がいそうである。
でも、これはおそらく、その「無駄」にみえるもの自体が研究の基盤その ものであり、それを削りとったので現状がある、ということであろう。
まあ私は今年度末でめでたく10年で理研とはおわかれである。元々10年いる気もなかったのでちょっと長居しすぎた。
特に体制が変わってからはチーム予算大幅減額とか色々あって、チームメンバーを別の予算でなんとかするとかしててチームとしてはあんまり活動してなかったし。
あ、これは別に理研が悪いとかじゃなくてトップダウンの組織である以上そういうこともあるという話である。
ロシア語 ХОЯТ-1 だと写真がでてくるが大体のサイトはウクライナで現在つながらない。そういうものか。
どちらも2週間で 2/3 に、という程度。本当にゆっくりとしかへらない。 ワクチン3回目が増えるともうちょっと加速するかもだけど、、、
なんかできた。相変わらずサイトで作って郵送。
普通の in-place のクィックソートって、2つに分けるので、状況によってはよくある大量に同じ値があるケースだと性能が落ちる。私が(30年くらい前に)書いたのはそのチェックをいれたりしている。
SIMD 命令で分けることにすると単純な実装では in-place ではないので、実は小さいもの、等しいもの、大きいものの3つに分けられる。そうすると同じ値が沢山あるとそこで終わるので再帰が深くならない。もちろんそれでも最悪コストはN^2だけど全部同じ値だとNになる。
日 本原子力学会推奨式のデータだともう1桁減って、10年のオーダーだと熱 出力から5桁下がると。3GWなら 30kW。まあそれくらいならみたいな。
チェルノブイリの電源カットした、というのは、他のもできるんだぞ、という脅迫なわけだよな、、、
でもって Ukraine calls for ceasefire to repair power line to Chernobyl nuclear plant という話もでてくると。
どうするんだろうねこれ。
まあ昨日研究(までまだちょっといってない怪しげな)ミーティングでオランダからでてる人が雑談で今我々が恐れてるのは核だ、っていってて、ヨーロッパは今そういう空気だろうな、、、
ただもうちょっと違うレベルの問題な気がするのでちゃんとみないと駄目か、、、
なんか駄目だ。このスライド作って初めてクィックソートをある程度ちゃんと理解した。で、書いたのがなんかおかしいことがわかった。
アルゴリズムや実装を論文とか発表にすることの意味というのは、少なくとも私の場合には、そういうことをしないと見つからない致命的な間違いをみつけることである。
Zen 3 って MAC x 2 + ADD x 2 なの? ADD だけなら4演算できる? で、 3 load + 2 store/cycle なのか、、、これProじゃないのはでるんだっけ?
GMail だけ GMail サーバーにするとかすればいいのかしら?なんか定期的にGMailに送れなくなる気がする。滅びて欲しい。
お、大学のサーバー経由なら設定いじればちゃんと GMail に届く。ふう。
マルチワードとAVX512とSVEに対応したいところ。 in place じゃないとか作りは色々雑。
そのロシアの隣国たる日本はどうするのみたいな。
Zaporizhzhia 5、6 は 2/25 に、1は2/27 にシャットダウンとある。3号機は止まってるらしいという情報がでてた。運転中のものが破壊されればチェルノブイリ以上のことになる。
改めて崩壊熱のグラフを見る。電気出力1GWなら1週間たっても10MW以上でるのか。メルトダウンできる計算か。
引用:人事課によると、准教授の一人は昨年1月、ミーティングを無断欠席した学生を研究室に呼び出し「お前不可だぞ。ここでぶん殴ってやりたいとこなんだなあ。殺すぞ、こら」と怒鳴って椅子を蹴り飛ばした。
引用:大学の調査で、10人以上の学生に対し「殺すぞ」「馬鹿」などの言動が確認されたという。准教授は「怒りで理性を失った」と説明しているという。
引用:もう一人の准教授は2020年秋、研究室に属する学生に「幼稚すぎて指導するレベルに達していない」「君は完全にダメな人間や」などと人格を否定する発言を繰り返したという。
引用:学生の相談を受けて研究科長が大学側のハラスメント防止対策本部に報告。大学のその後の調査で、この准教授をめぐって13年以降、10人以上の学生が研究科へアカデミック・ハラスメントの被害を相談していたことが判明した。
引用:研究科は准教授にその都度注意したが、大学に報告はしていなかった。人事課は「隠匿とは認められないが、研究科の対応には疑問が残る」としている。
引用:大学の調査では、研究室の複数の学生らから「ゼミは長時間にわたって理不尽な叱責(しっせき)が科される場所だった」との証言もあったという。
こういうのはちゃんと学生いかないようにするべきな気が。駒場では某S氏、と書くまでもなく本人の本に書いてあるから佐々木氏でいいと思うけど、を大学院担当から外すとかしている。大変だったという話を某氏から聞いた。
こういうのは普通は一方だけから話を聞いてもなんだかわからないことが多いが、これは一方の話だけ(加害側)から加害側に明らかに問題があるとわかる例になっている。
3/1の 疫学・統計解析委員会資料 。最初に 「全県的に流行規模は横ばいで推移しています」とか書いてあってうーんである。
xxx@xxx.ocn.ne.jp からきたのをみると最初はインドネシアとかのIPアド
レスなんだけどちゃんとocn の中通ってきてる。ただ、何故か
Foo どちらもあんまり減ってない。増えてはいない、という程度。
この、すごく速く増えたあと非常にゆっくりしか減らない、という状態をある程度きちんと表現できる数理モデルってあるのかしら?平均場的なSIRとかだと速く増えたら必ず速く減る。
カップリングが弱くてRが違う系が沢山あるとこんなふうになる気はする。ゲノム解析とかちゃんとできてれば色々わかって対策も進みそうな気が、、、
でもその巻が本棚のどこにあるかわからない。
発掘した。白水社だと10巻、第7部71節である。ちなみにノーベル文学賞は第7部に対して与えられてるんだそうな。
製造コスト的には HB のが安そうな気が。
今日はミーティングと色々対応。
もちろんアメリカや中国に非難されるべき行為がなかったというわけではない。