つっても、非公開のを別につけているわけではない。
Copyright 1999- Jun Makino
2022/08 2022/07 2022/06 2022/05 2022/04 2022/03 2022/02 2022/01 もっと昔引用:理研では今年4月1日時点で在籍する約2200人の任期付きの研究者のうち、約200人が対象となる。23年4月から雇用期間にかかわらず、新たな研究プロジェクトに応募できるようルールを改める。
引用:審査を通過しプロジェクトに続けて参加できれば、雇用の切れ目をなくすことにつながり、研究者は無期雇用への転換を申し出る権利を獲得できるとしている。
「新たな研究プロジェクトに」だと現在所属するプロジェクトには応募できないように読めるが、「プロジェクトに続けて参加できれば」だと継続もありそうに読める。
しかし「無期雇用への転換を申し出る権利」って、10年超えても無期雇用への転換しないこともありえる?
2022年9月30日 理化学研究所 新しい人事施策の導入について
引用:現在従事している研究プロジェクトでの期限における任期満了後、別の有期の研究プロジェクトに参画できる機会を提供するため、理研での通算契約期間の上限規制を撤廃します。
なので別のプロジェクトに応募しないといけないと。
で、新しいプロジェクトに移動してから無期雇用への転換を理研に申し出る権利を獲得する場合に誰がお金だすのとかは不明な感じ。
と思ってたらうっかり OS アップデートが、あと6分とでている。10時からの会議の前に私は Zoom 動作確認できるか?
Linux ノートでももちろん Zoom 動くし Surface Go もあるからなんとかはなるんだけど。
間に合った模様。マイクの音もひろわれている。ふう。
まあそのM林君と某君がいるわけだが、、、「宇宙物理学などデータサイエンティスト」だったのか。
引用:追悼の辞で触れた、安倍氏の議員会館の机で見つけた岡義武の著書「山縣有朋」。菅氏は「(安倍氏に)その本を薦めてくれる人がいて、読んでいるということは聞いたことがあった」とし、その本に「たまたま端の部分を折って、そこにマーカーまで引いていたんです」と回顧。
もしも本当なら誰がいつどんなふうに薦めたのか大変興味深いところである。
というか、これ、最後のパラグラフが謎なんだけど、安倍氏が亡く なってから衆院第1議員会館1212号室にいったら岡義武著「山県有朋」が机の 上にあって「かたりあひて 尽しゝ人は 先立ちぬ 今より後の 世をいかに せむ」があるページが折ってあって線がひいてあった?
直前にそこを読んでたということ?
ちなみに、 SR の出荷予定は 2021/6 まで「2021年中」、2021/6 に 「2022Q2」、2022/6 に 「さらに遅れる」、2022/8 に「2023Q1以降」。
とはいえ、これで A100 より速い、と言われると Ponte Vecchio いらないじゃん、となるわけで Intel 相変わらずである。
新しいのというか、しばらく前に画面真っ黒になって死んだかと思ったら 電池ぬいて戻したら復活した HP の機械がもう一台ある。 Ubuntu 22 にして色々移行しないと。
MacOS on arm だともっと色々起こる。まあこれはしょうがない。
「東京大学AI研究会」で検索するとaiabeshinzo.comなるサイトに。そういうことですかみたいな。
BA.4.6, BA.2.75, BA.2.75.1, BF.7, BQ.1.1 あたりが次の波の候補であると。
あ、パスワードかかってた。日程調整の元ファイルをパスワードかけた zip にしててエクセルファイルにはパスワードがかかっていないものを送ってくる意味はなにか?
セキュリティが怪しいWebベースのを使うのもどんなものかという気もするが、それならオンプレミスのなにかを、と思うわけだがそれは多分様々な理由でできないんだろうと想像される。
HPCでは専用化がくるかというとどうなんだろう?粒子法だと、例えば重 力やクーロン力のパイプラインは汎用のFMAに比べてトランジスタ効率が数十 倍よいので、演算器のトランジスタの10%くらいをそっちに、というのは論理的にはありえる。
規則格子差分法も、固定小数点の引き算で大体の演算をすませられるはず で、FMA ユニットで差分法回すのはものすごく無駄が大きい。
非構造格子でもメッシュ座標を離散化すれば element-by-element なら乗 算器のビット数減らせない?
密行列の対角化とかはなんかできてもいいはずだけどぱっとは思いつかな い。高次モードはあんまり精度いらないはずではある。
まあ段々 Top500とか Green500 はよい指標ではなくなるということではあろう。 今は実アプリでの電力性能が Green500 の数字より全然低いんだけど、これが 逆転できるようになれば Green500の数値には実用上の意味はないわけで。
これ、検査で見つかった新規陽性者数はピーク4万で9/12の週は1万くらいで1/4くらいなのにこっちは1/8になってて、ピーク時にはまともに検査できてなかったことを示唆している。
レッドはどうなんだろう?
これ、(まあ当然だと思うけど)医療現場の側には「まともなコロナ対策があるはずでである」という期待があって、なのでそれが見えない、と思うんであろう。
実際には見えているものが全てで、要するに「コロナは終わったのでなにもしない」が現政権の政策であろう。
激辛「ししとう」の見分け方。辛くなってしまう、ちょっと切ない理由とは? には天気によるとか書いてある。
NGACI 更新版かな?電力性能一番いいのでだいたい300Wで90TFで300GF/W。 システムとしては250GF/W くらい。
H100 は48TF 350W で 140GF/W なのでシス テムとして80-100GF/W くらいはいくとするならそこから2倍ちょっとしかいかない見積もりでまだちょっと悲観的な気が。
まあ開発目標としては500-1000TF/W としないと競争に勝てる気がしない。
滝脇知也 「計算科学ロードマップの基礎科学分野の更新状況:宇宙惑星」 似鳥さんコメント
レジスタ足りない、命令レイテンシが大きい、キャッシュレイテンシが大きい、分岐に弱いと。
レジスタ不足問題はSVE設計した人々が論理レジスタ32本絶対だったせいが9割くらいはあると思うけど、キャッシュはねえ、、、
なんだこれと思って推薦書依頼メイルを確認したらそれとは違うアドレス に確認メイルしてと書いてあった。そっちには送れた。
「学生を連れた複数の出張で、自家用車で移動したにも関わらず、公共交通機関を利用したと虚偽の申請を行い、実際よりも過大な旅費を大学に支払わせた」
太古の昔だとこういうのでお金浮かせて学生実習の費用とか支払いが制度上難しいものの購入にあてるということがあったみたいだけど、今はもちろん駄目だし自分のポケットにいれるのはそれ以上に駄目である。
もう絶滅したと思ってた「預け金」と同じでまだやってるところはやってたりするのかしら?とはいえ研究・教育以外にはそれでも普通は使わないような。
その辺違う「常識」が違うとこにはあるのかもだけど。
「人は、ルールに違反した相手に罰を与えると、脳の報酬系回路の一つである『背側線条体』が活性化する。ここが強く活性化した人ほど、自分が損してでも相手に罰を与えようとする傾向があることが、実験で確認されています。つまり、叱る依存の落とし穴にはまりやすい」
「パワハラ上司扱いされたくないから必要な指導もしないのは、企業にとって損失です。近年、こうした傾向への解決策として、職場で自由に意見できる『心理的安全性』が重視されています。心理的安全性があれば、処罰感情もわきにくいのではないでしょうか」
OpenCL の仕様では、Read/Write Buffer とカーネル実行は非同期にでき るけど、これは1回のカーネル実行単位でカーネルの中にイベント発生とか イベント待ちをいれることはできない?カーネル起動にオーバーヘッドありそうな のでそういう感じのが欲しい気が、、、
でないとカーネルの融合みたいなことをしないといけなくなりそう。
この辺結局 oneAPI であろうが OpenMP だろうが OpenACC だろうがみん な同じで、共通のアプリケーションソースからコード生成ならもっと 高レベルの記述が必要。まあ深層学習ではその辺できてるし PIKG も まあできてる。
つまり、アプリケーションは式だけ書いてあとは DSL に全部おまかせ、 みたいなのでないと結局は無理ではある。
とはいえそんなのすぐにはできない(FDPSは結構それだが)ので、まあ、みたいな。
とはいえ核沸騰から膜沸騰への遷移みたいに一気に効率が落ちる気しかしない。
10Msun だと Solar metalicity で普通に作ってもいけるんだっけ?
だとすると Open cluster の形成時に色々あってできたみたいなのが普通なシナリオかなあ。
Search for a Black Hole Binary in Gaia DR3 Astrometric Binary Stars with Spectroscopic Data -- こっちは谷川君で2日早くastro-ph にでとる。コンパニオンが巨星なので BHと確定はしてないと。
前偏の新型コロナを「当たり前の感染症」として受け入れた時、何が起きるのか? 感染者はインフルの数倍から10倍に -- 良く読むとすごいことが書いてある。「つまり1日あたり20万〜40万の新規 感染者数が出る状態が続くわけです。」これはそうで問題はその次。
続き「そのうちの1割ぐらいが報告されるとすると、ニュースで報道されるような1日 の新規感染者数2万〜4万ぐらいがずっと続く」 そこまで発見率について悲観的ですか、、、
分散メモリ大規模 SIMD アーキテクチャのプログラミング環境ってほぼロストテクノロジーで、古代遺跡から発掘された文書みたいな感じがある。
今時のGPUとかとの違いは、CMもそうなんだけどホストがPEメモリをPIOアクセスするのでそこそこ性能がでる(くらいホストCPUが遅かったということでもある)ので、ブロック転送みたいなシンタックスがないこと。
チップレットで UCIe で接続になったらそういうがまたできるようになるかというと消費電力的にどうせ無理。UCIe上でキャッシュコヒーレンシを実現してユニファイドメモリ、みたいな話がこれからでてくると思うけどこけるに決まっている。
おお、TR-IT-0023 用例検索の超並列計算機CM-2 を使った高速化 なんてのもある。
MasPar と CM の大きな違いは、CMではPEアレイは仮想化されていて PEを論理的に複数のPEに分割できるので、例えば大きな配列を分割する時に 要素1つを1つの仮想PEにマップして、1つの格子点用のプログラムを書けば いいので記述量が少ないことである。
例えば差分法では、仮想PEの番号でPE内か外かがわかるのでコンパイル時 (あるいはライブラリ実装として)そういうコードが生成されるはず。
CM-Fortran では PE 32 個を基本ユニットとして扱うモードが導入されて たけど、これではどうやったんだろう?と一瞬おもったけど、これはそもそも F90の配列記法を使うので仮想PEとか関係ないのであった。
午前はソニー高安さんのあと近藤さん、天野さん、牧野の話。
現在近藤さん。
天野さん。今日はFPGAの話。
FPU もってる Stratix-10 でもGPUとの対抗は厳しい。最新プロセス使うのは難しくなった、設計環境がCPU/GPUとか根本的に違う。
FPGA はまだ 16nm (ACAP Versal はもうちょっと先、Intel はIntel 10nm)。
C++/C で記述したいソフトウェアを載せるのは「基本的に不可能」
と思っていたら早速そもそも時間を間違えていたと判明。すみません、、、
と思ったら次は大先生のところでやはり階層的3体。Iwasawa et al. 2006 が最初にでてきとる。
hostfile 作って localhost slots=4 とか書けば回避できそう
第14回 私と医療 ゲスト森下竜一 「78(昭和53)年に灘と武蔵を受験し、合格した武蔵高校に入学」ってえらく正直に書いてあるな。
こっちだと「医学部へ行くんだったら東京だろうということで、東京の私立高校を受験」になってる。
中高の同期で阪医にいった連中はこの人と大学で同期なわけで共通の知人は一杯いるがこの人とは特になにもない。
HIT の前ってなんだったっけ?日本アスペンシステムズとかあったような。あともうひとつかふたつ。
怪しげなモデル使って球状星団内でできそうな BH binary から GWTC-3 の質量関数を説明できるか調べました、という論文。 Mark Gieles がはいっ ている。 Antonini は、、、Capuzzo-Dolcetta のとのの出身か。
Primary mass が 7-40Msun のところで GWTC-3 は質量軽いほうが増える のが、モデルは減っていて全然あわない。10Msunで100倍くらい違う。
これ多分、BH クラスタの進化モデルがいい加減なせいだな、、、コアが1ゾーンで重いBHB 進化させるのに軽いのとも相互作用することになってて、軽いBHBあんまり作 らないようになってる気が。
大抵の大規模 SIMD に対する疑問と回答は Hillis のD論に書いてある、、、失われた知識ではある。
まずパイプラインが浅くて、で、固定長ベクトル命令なので 直前の命令の結果が使える。
なので、ループアンロールとかソフトウェアパイプライニングとかそもそ も必要ない。命令のスケジューリングも不要。まあ、始めから4重にアンロールされるものしか書けないともい える。
この辺は古典ベクトルプロセッサと同じ。
PE レベルでは演算器は1つなので、コア内SIMDユニットと違ってデータの 並べかえとか考えなくてもいい。
メモリアドレスは全ビット即値指定可能で、実行時にアドレス計算どうす るかとか考えなくてもいい。物理レジスタも全部アドレス指定可能。 なのでもちろんリネーミングとかない。
あるレベルでのデータの放送が、1命令で、4サイクルとか8サイクルでで きる。これはキャッシュベースのメニーコアでは本当に問題で、基本的に アップデートしたコアのデータを他のコアが順番に読むみたいなことが起こる。
なので時間もかかるし電気も食う。
あるレベルでのデータの総和が、1命令で、4サイクルとか8サイクルでで きる。これもキャッシュベースのメニーコアでは本当に問題で、みんなが共有 キャッシュに書いて誰かが合計みたいになって非常に時間がかかる。
結局こういうのがあるので普通のメニーコアでは細粒度並列は性能でない。
まあこれはGRAPE-DR/MN-Core が偉いというよりレガシーな命令セットのプロセッサコアにコヒーレントなキャッシュ つけてメニーコアというのがそもそも無理だという話なんだけど、それでもな かなかみんなそこから離れられないわけで。
つまり、レガシーな命令セットとコヒーレントなキャッシュは、現在の現 実としてはハードウェアやデータパスを隠蔽することによって、その性能を生 かすのを極めて困難、場合によっては不可能にしてしまっている。
で、一度その辺を捨てないと、我々は進化の袋小路からぬけられない。
まあ、現在そういうわけで性能をだすのが非常に難しいパズル解きになってるわけで、 そういうので喰っていきたい人もいるであろうという気はする。
逆にだからそういうのが飯の種な人は MN-Core みたいなのには興味を示さないわけか。その人でなくても性能でるから。と、これはちょっと余談。
この辺のことは去年だした本に書いたわけだけど、あれやっぱり日本語版 いるか。まあでもプロセッサ作る人むけでそんな人ほとんどいないので数が でる本じゃないよね、、、
汎用プロセッサだと Zen4 みたくトランジスタつぎこんでちょっと速くす る、という方向にまたむかうのかもだけど、例えば Zen2 のコアのままで 数だけ増やすほうが並列化できてれば性能上がるんでは?という気がする。
まあデスクトップだとそれでも1コアの性能があがって欲しいとかあるん だろうけど、サーバーなら関係ないし多くの場合に沢山独立したプロセス が動いてるだけだから、キャッシュコヒーレンシってOSとの関係くらいしか 意味ないのでなんかもったいない。
まあその辺に サーバー用 Arm の狙い目があるんだろうけど。
ちょっと話は違うが本当に巨大な単一メモリを多数のコアが(SIMDかMIMD かはともかく)ランダムアクセスしたいようなアプリケーションはどうすれば いいか、という問題はある。
HPC でそんなアプリケーションはあるか?というとあんまりないんだけど。 ランダムアクセスといえば有限要素法だけど、これは領域分割必ずできるので、 1コアが広い共有メモリ全体をランダムにアクセスする必要はない。
ポスト京ターゲットアプリケーションだと、そういうのは多分 GENOMON (の中にはいっている bwa-mem) くらいで、あれは名前の 通りの BWT で作ったでかいテーブルがどうしてもランダムにアクセスされる。
ただこれは BWT 格好いいんだけどそういう意味で局所性に問題あり、と いう話かも。