牧野の公開用日誌

つっても、非公開のを別につけているわけではない。

2025/02 2025/01 2024/12 2024/11 2024/10 2024/09 2024/08 2024/07 2024/06 2024/05 2024/04 2024/03 2024/02 2024/01 もっと昔

2006/10/xx UPn 〆切仮題「重力多体系と専用計算機」
2025/3/6 13-15:30 FS 評価委員会

定例

2023 4Q 木曜1限惑星学基礎III
2023 4Q 木曜2限惑星学基礎III 演習
火曜 13 学生自主ゼミ
火曜 10 GFC
火曜 13 コデザインチーム定例 (23/4-)
火曜 16:30 CPS 定例
水曜午前(原則)研究室セミナー
水曜:惑星学初年次セミナー(第1Q水2) 牧野がいないといけないのは 6/1
水曜 13 神戸大B4定例
木曜 13 PFFS arch 定例
木曜 14 PFK 定例 (biweekly)
木曜 14 PFFS software 定例 (biweekly)
金曜 11 GPFN4 SW
金曜 13 GPFN4
金曜 16 PFFS all 定例 (biweekly)
木曜:専攻会議 12:20 (月に一度)
神戸大学カレンダー 7/19 木曜 7/20 金曜

地震・原発関係リンク

2025/3/29

密度波理論って実はちゃんと論文読んだことなかったんだけど、モーメント方程式で速度分散ぬいたのか、、、まあなので温度0の流体としているので、まあああなるのはわかるというか、ねえ、みたいな。

2025/3/26

何か「輩出」という言葉の新しい用法が発生しているのかしら?
従来の用例はこんな感じで、多数のなんとかが生まれる、あるいは送りだす、なんだけど、「〇〇大学が私を輩出しました」といういいまわしが発生しているような。

2025/3/25

午後はシンポジウム「ポスト富岳で拓くアプリケーションの未来」自分の発表はないので基本ひやかし。
栗原さんの「挨拶」が滅茶苦茶マニアックというか細かいところにはいった話ですごい。
佐野さんからアーキテクチャについて紹介。
佐藤さんからシステムソフトウェアについて紹介。
招待講演最初は堀田さん。いきなり、あんまり性能あがらないから性能が高い FP16, FP32 の性能をと。
FP32 はだめなんじゃないかな、、、
384億格子点、3000万ステップの計算に挑戦したが、、、という感じ。 4096ノードで1年とか。12PF なんで、、実行効率 10%くらいとのこと。
現在のポスト富岳システム案、ノード数というよりフルレチクルのダイの数と演算性能だと、演算性能は Rubin の 1.5倍くらいだと大体 2万5000ダイでいける。FP8 12PF/ダイ。 Blackwell は5、Rubin は8くらい、
そうするとメモリバンド幅がダイ当り 32TB/s になって、これは本当にできるの?感はある。Rubin Ultra が HBM4e でダイ当り 8TB/s なのでその4倍。
まあそれでも 32TB/s しかないのか感はあり、HBM5 とかかな？
N で 25000ダイが予算にはいるか問題はありそう。Aならはいるが。

2025/3/23

AMD Instinct™ MI325X アクセラレータ。HBM3E メモリクロック 6GHz メモリバンド幅 6TB/sと書いてある。
B300 は 8TB/sっぽいので、メモリクロックは 8GHz なんであろう。
そうすると VR200は HBM4 で 6.4GHz、VR300 は HBM4e で 8GHz ということになる。 HBM3e 9.6GHz はいずこ、みたいな。
明後日が〆切の文章を書こうとしているんだけど、うーん、どうしようこれ？

2025/3/21

神戸大学理学研究科附属惑星科学研究センター事務補佐員募集しております。 3/31 〆切です。興味ある方は是非。
Britain Issues Travel Warning for US --- なんかすごい。アメリカがもう普通の外国人が渡航するには危険がある国になったと。
米当局、フランス人研究者の入国拒否　「トランプ大統領に言及のメッセージ発見」理由に -- 「宇宙分野の研究者」だれだろう？とそれはともかく。まあ日本も学術会議問題とか放置すればこうなる。

2025/3/20

NVIDIA HGX Platform-- B300 は B200 に比べて dense FP4 の性能が1.5倍になった分 FP64 の性能が、、、1/30に。まあ汎用HPCはもうどうでもいいと。
英、使い道ないプルトニウムを地中に廃棄方針　保管する日本分は未定 -- イギリスはこの辺現実を見ることができるのがすごい気が。日本は破綻するまで認められなさそう。

2025/3/19

■かっこを多用する人っているよね素で Lisper? と思ったが全然違う話だった。
Rubun Ultra NVL576 は4レチクルの Rubin Ultra が144枚かな？そうすると Rubin Ultra は 16HBM4e で 32TB/s、1GPU あたり、、、4KW と書いてある気がする(Tw のほうに。ラックあたり 600KW)
3KW としてもフルレチクルあたり 700W をあんまり変えないということかな。トランジスタ密度上がるからもうちょっと電力増えそうで、実際には Rubin Ultra だけで 4kW 超えるくらいかな。
Nvidia announces Rubin GPUs in 2026, Rubin Ultra in 2027, Feynman also added to roadmap -- Tom's hardware のまとめ。
なんかもう電気沢山使うのがこれからは大事だみたいな感じになってる、、、

2025/3/17

今月中にやろうと思っていたことが実は10ヶ月前に大体やってあった。すっかり忘れてた。

2025/3/15

NVIDIA GTC Outlook From A Top Analyst -- GB300 の TDP は 1.4KW、Rubin は2026登場で 1.8KW と書いてある。

2025/3/13

These Words Are Disappearing in the New Trump Administration -- 真に1984的世界である。Trunpspeak。

2025/3/12

AVX512 って vmovups で unaligned store できるよね？ clang の自動ベクトル化でこれ吐くようにする方法あるんだろうか？

2025/3/11

メイル少ないと思ったらおうちサーバの / があふれていた。ありゃ。エラーになってたらすみません。

2025/3/10

知らない業者さんからの営業メールで預かり金やりますというのがあったんだけど大丈夫なのこれ？
確定申告をするべく机の上につみあがっている未開封の封筒やらなんやらを処理して関係書類を発掘する。山自体は大体処理できた。

2025/3/7

SBI、台韓2社と交渉　宮城半導体工場で協業 -- UMC の名前がみえる。韓国は SK-Hynix かな？
SBI negotiating with SK Hynix, UMC on Japan chip plant collaboration, report says -- "with SK Hynix on back-end DRAM processes and with UMC on chips for vehicles" UMC で車載は微妙な気が、、、
2024年度国立情報学研究所退職記念講演会（漆谷副所長・石川教授・井上教授） -- 石川さん大妻と聞いたような。
「プロセッサベンダがFortranコンパイラを提供しなくなる時代」まあそうなったら CIVIC compiler みたいなのを作るんだわね。CFT が××だったのでリバモアでコンパイラ作ってた。これの拡張機能が CFT77 には大体はいったはず。
今は LLVM Flang-new もあるのでまあそんなに大変じゃない。
そういうわけで Fランといわれるとまず Flang のことかなと思う。みんなそうだよね？
まあ Fortran よりも倍精度実数の性能が限りなく落ちていきそうなほうが問題な気が。
Lars Hernquist の TREECODE (大文字)は CIVIC でしか動かないというのは彼の87年の論文に書いてある。これは CFT には再帰がなくて再帰的なtreewalk が書けなかったから。
で、彼が IAS にきて、再帰のない Cyber-205 FORTRAN 200 でどうすべえ？となって明示的スタック使うコードにしたんだけど、もちろんこんなのはベクトル化できない。
というので私がスタック使わない tree walk に書換えてさらに複数の tree walk 方向に並列化というかベクトル化したのがVectorization of a treecode
これやってたのは D1 の時か。

2025/3/6

AMD revises MI300 series sales upward to US$5 billion in 2024 -- MI300X って結構売れ行き順調？
「次世代計算基盤に係る調査研究」評価委員会（第13回）配布資料 -- 今日の資料。

2025/3/4

輸出サーバーに規制対象の半導体搭載の可能性－シンガポール当局捜査 -- シンガポールに大量の H100とかが出荷されていてどこかに消えている問題の話。
Man Watching (Desmond Morris) とか今だとどんなふうに読まれるんだろう？動物行動学から人間の「社会的」行動とか色々を説明するみたいなの。
極端な例えとしては伊藤計劃の「虐殺器官」における「虐殺文法」みたいな、表現が人間の行動をコントロールするものが実際にあったとして、「表現の自由」はどうしようみたいな。
実際には、「虐殺文法」は本当に実際にそうなのか？に決着がつかないうちに人類が、でなくても文明くらいは滅びる、というのがありそうではある。

2025/3/3

まあ確かにそのうち ADS も廃止とかになりそう。昔は三鷹とかにコピーがあった気がするけど今はないよね。
児童相談所におけるＡＩを活用した緊急性の判断に資する全国統一のツールに係るＡＩアルゴリズムの開発・テスト業務一式（令和６年度） -- これかな?これ自体は4億円だけど。
CPUの王者インテル、GPUの夢を叶えるには険しい道のり本文の最初は「インテルのGPU「Falcon Shores」は期待に応えるかもしれない」で次の小見出しのあとは「期待に添えない可能性がある」。
CPU King Intel Faces Rocky Road to Achieve GPU Dreams の原文でも最初は may で次は may not。まあどっちもかもしれないだから矛盾はないし、そもそも may or may not といういいまわしもある。
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC　IEDM 2024レポート -- 主な話はTSMCの、これ多分 CoC? の高密度接合。10um 切りますよと。で、 900Tbs/mm^2/pJ/bit という謎な単位がでてくる。
WoW ならもっとピッチ小さくできるので、多分これは CoC だろうと想像。 4Gbps で1mm^2 あたり1万本だと 40Tbps/mm^2 で、0.05pJ/bit だと前者を後者で割ると 800 がでてくるけどその意味がよくわからない、、、
2 月4日の火災の原電の報告、 2月20日の茨城県の報告と合わせて読むと大変アレ。
原電の報告書には「ヒューズを大容量のに変えたのについて「今回のシェアバルブの作動試験は，制御盤工場出荷時の試験方法を参照して実施した」と書いてある。
県のには工事要領書にも作業票にもヒューズを大容量のに変えるなんて書いてない、と書いてある。
これらだけからは、手順書に書いてないことを現場が「制御盤工場出荷時の試験方法を参照」して勝手にやった、と読めるが、本当にそうかどうかはわからない。
でも、まあ、JCO の事故みたいな、これやったら何が起こるかわかってなかった感はある。

2025/3/1

3月である。
RTX5090 は N5 で 750mmsq 92Bトランジスタ、H100 は N4 814mmsq で 80B トランジスタと資料には書いてある。N4 ってまあ実質N5 だとは思うけどトランジスタ密度が 1.2倍違うのはなんだろう？
HBM がない分 5090 の製造コストは安いけど、売り値は10倍以上違うわけでなかなか無理がある値段設定な気が、、、それでも日本で買うと60万とかですごく高いんだけど。
米海洋大気局が職員８００人解雇、週内に千人超も　予報や気候の専門家が対象 -- NOAA の職員数は(片岡さんによると) 12,000 人だそうで、10%近くいきなりカットと。
なんかこう文化大革命的、、、
- 牧野のホームに戻る