牧野の公開用日誌

つっても、非公開のを別につけているわけではない。

2024/11 2024/10 2024/09 2024/08 2024/07 2024/06 2024/05 2024/04 2024/03 2024/02 2024/01 もっと昔

2006/10/xx UPn 〆切仮題「重力多体系と専用計算機」
2024/12/5 8:50 惑星学基礎III 1回目
2024/12/12 8:50 惑星学基礎III 2回目
2024/12/14 13 神戸車検
2024/12/16 10:40 CPS 評価委員会
2024/12/19 8:50 惑星学基礎III 3回目
2024/12/23 12-14 チーム別
2024/12/26 8:50 惑星学基礎III 4回目
2024/12/27 ポスト富岳FS合同シンポジウム
2025/1/6 15-17 NEDO 技術推進委員会
2025/1/9 8:50 惑星学基礎III 5回目
2025/1/16 8:50 惑星学基礎III 6回目
2025/1/21 CPS セミナー毛利さん
2025/1/23 8:50 惑星学基礎III 8回目
2025/1/29 18 チーム別
2025/1/30 8:50 惑星学基礎III 8回目
2025/2/13 修論発表会
2025/2/19 卒研発表会
2025/2/26 18 チーム別
2025/3/6 13-15:30 FS 評価委員会

定例

2023 4Q 木曜1限惑星学基礎III
2023 4Q 木曜2限惑星学基礎III 演習
火曜 13 学生自主ゼミ
火曜 10 GFC
火曜 13 コデザインチーム定例 (23/4-)
火曜 16:30 CPS 定例
水曜午前(原則)研究室セミナー
水曜:惑星学初年次セミナー(第1Q水2) 牧野がいないといけないのは 6/1
水曜 13 神戸大B4定例
木曜 13 PFFS arch 定例
木曜 14 PFK 定例 (biweekly)
木曜 14 PFFS software 定例 (biweekly)
金曜 11 GPFN4 SW
金曜 13 GPFN4
金曜 16 PFFS all 定例 (biweekly)
木曜:専攻会議 12:20 (月に一度)
神戸大学カレンダー神戸大学予備日 6/11, 8/11, 11/22, 2/10 7/19 木曜 7/20 金曜

地震・原発関係リンク

2024/12/30

「サムスンやＳＫとも競争可能な水準」…業界が驚いた中国の半導体技術 -- まあ EUV なしで作れる範囲で、ということなんだけど、NAND で既に HB 使ってるというのは重要。NAND で使えるなら DRAM でも使えるわけで、

2024/12/27

今日はポスト富岳FS合同ワークショップ
栗原室長が滅茶苦茶濃い発表ですごい。
HPCI の運営 173億。補正予算19億。来年度予算今日閣議決定とのこと。
富岳の開発今年度補正69億来年度予算8億。
高木さん私見。(富岳の経験から)ハードウェアよりもソフトウェア開発、運用費の充実が重要。
ポスト富岳ではソフトウェアの開発が負担になる。ここの手当が必要。
性能チューニング、フルスクラッチからの開発。
成果をだす人が重要、コンパイラの機能回路も重要。
高木さんのって要するに「京」と富岳でこれが足りなかったよねという話だ。
GPU は国産して欲しいと。
LLM の教師データを作るのは HPC。単精度はせめて。
焼野藍子さん。
流体の HPC でなければ分からない性質。
市村さん。わりと行列乗算使う方向で一杯アルゴリズム開発しているという話だったような。
小島熙之さん Kotoba Technologies。生成AI。音声認識、同時通訳等。
現在は学習90%、推論1%、データ準備9%。1年後は推論35%。
学習。ハードウェアの陳腐化のスピードが速い。沢山計算資源をもっているところが開発が進む。
学習ではやりかたが固まってきている。
推論ではコスト面が厳しいので逆にあんまり陳腐化は問題になりにくい。並列化もあんまり問題にならない。
推論の高速化の人材不足。
推論のモデルは2桁Bくらい。量子化も有効。
栗原さん。

2024/12/26

中国では computing in emmory/near memory computing を「存算一体」というと。
割と色々やられているっぽい。

2024/12/25

ちなみに MN-Core 2 はレジスタが512個ある上にメモリもオペランドになるのでさらに4096語が全部レジスタみたいなものです。なのでループアンロールしてもレジスタ不足で性能落ちるとか絶対ないし、そもそもベクトル命令なのでアンロールも必要ない。
明日の講義の準備(というか先週の課題の採点と講評)をして、あとは今日〆切の(いやなので17時前に送られることが期待されてたんだと思います。ごめんなさい)なんかの採点すれば〆切が今日な仕事はおしまいなはず。

2024/12/24

ここ2年くらい？使ってた USB C PD +A 電源、LED はつくのに C に電源供給しなくなった模様。明日どっかで買わなくても予備あることはあるんだけど。

2024/12/23

ここ数週間諸事情で狂気のスケジュールが続いてて絶不調である。
27日のスライドでっち上げて送った。「１）今回の次世代計算基盤に係る調査研究(FS)の良かった点（どう機能したか）・改善すべき点」って私が何書くかくらい予想つくよね？

2024/12/22

某秘密会議向け資料なんだけど別になにも秘密情報はない割には面白い話なのでここに書いておく。DRAM のアクセスエネルギーって実は 99% 配線なので、3D積層で2桁下げられる可能性があって B/F=4 だって全然可能という話。
DRAM セルの容量 : 10-20 fF。従ってアクセスの消費電力は 10fJ程度でしかない。ゲートの消費電力は 1ゲートあたり 0.1-1 fJ 程度。沢山ゲートいれてもしれてる。
ところが、配線の寄生容量は 1cm あたり 2pF あって、アクセスの消費電力は 1pJ 程度。HBMでは色々あわせるとまだ 10pJ近い。
つまり、現在の DRAM およびロジック製造技術でも、メモリアクセスエネルギーはもう2-3桁下げる余地がある(配線長を 1mm 以下にすれば)
Memory Wall(Wulf and McKee 1995, Wilkes 1995) は3次元実装と分散メモリアーキテクチャで本当に解消する。BF=4 の計算機も将来にわたって可能。
さらに IGZO DRAM とかにすると低電圧化ができるはずで、もう1桁くらいエネルギー下がってもいい。

2024/12/21

Samsungが半導体事業の本拠地を平澤に移転か？　韓国メディア報道 -- GAA 相変わらず歩留まり問題をかかえているのを改善するべく頑張ると。
せっかく TSMC に先行して GAA 導入したんだから頑張って欲しいところ。

2024/12/20

2年前の記事ですが China May Win in AI Computing Leveraging Hybrid Bonding as an Alternative to Dimensional Scaling
なんか、ソ連相手だと先端技術禁輸が効果あったと思うんだけど、中国相手で半導体だとあんまり上手くいってない気がする。これ、根本的には、EUV 使わないと作れない半導体の性能メリットが、EUV なしでつくれる14nm あたりに比べてそんなに大きくないからではないか。
もちろん、同一アーキテクチャのシングルコアとかだとそれなりの性能向上があるんだけど、 CMOS スケーリングが成り立たっていた時代とは違うのでコストとか電力あたりで10倍とかの差にはなかなかならない。
そうすると、結構実装方式やアーキテクチャの違いが効いてくるので、既存のエコシステムを捨てられるほうが有利になる。
2015年くらいまでの CMOS スケーリングが生きていた時代とはゲームのルールが変わってるんだけど、あんまりみんなそのことを理解しないで同じやり方で勝てると思ってるところがある。

2024/12/19

TSMC Details Its High-End “2nm Process”, Revealing Massive Performance & Efficiency Improvements
本当に電圧さげた分がほぼ電力向上の理由だから、はじめから 0.55V とかだとプロセスノードが進んでも電力低減の効果は小さくなる。同じ電圧だと12%くらい速くなって2%くらい電力減るので、まあ10%ちょいは電圧さげた以外の貢献もある。
このグラフ、書いてある数字に意味があるとすると縦軸も横軸も原点通ってないことがわかる。

2024/12/18

宇宙古代都市の建設ラッシュを止めるブラックホール -- これ、「宇宙古代都市」という言葉はどう研究成果と関係してるの？

2024/12/18

2024/12/16

[News] Advanced Semiconductor Packaging Technologies Emerging -- 3.5D とか 3.3D とかって、、、
AMD のは F2B なんだっけ？ TSMC なので F2F で WoW じゃなくて CoW で3um ピッチとかやりますという話なんだよねこれ。
でもって富士通はMONAKA でも相変わらず Broadcom 使ってますと

2024/12/14

徐々にベールを脱ぐRapidus新工場、最新の状況は？ -- 「2nmなら電力消費が40nmに比べて20分の1に」ってのは、CMOS スケーリングが成り立ってればそうだけどさすがに今はないのではと、、、
酸化物半導体を用いた新しいDRAM（OCTRAM）技術の開発を発表 -- キオクシアと NANYA がIGZO DRAM やりますという発表。
グラフだけ見ると電圧 0.3-0.5V くらいで動きそうにみえるけどそうなのこれ？ Off 電流も小さくなってるのでリフレッシュ減らせるのと高温でも動作可能かも?
まあ随分昔から話はあってなかなか実用化まできてなかったわけだけどそろそろ本当にくるのかも。

2024/12/13

(作る力があるとしてよいものを作る力があるかどうかはまた別かなあとちょっと思った)

2024/12/12

今日の予定が全て終了した。虎ノ門での会議のあとにまだ社内会議があった。

2024/12/11

今日から明日の予定が、、、夜SEMICON JAPAN のなんかイベントにでて、それから神戸に移動、明日午前は山で講義して、午後東京に移動してSEMICON JAPAN で講演、それから虎ノ門に移動して会議。
なんかこう人生の選択を誤った気がする。もうちょっとこうシミュレータとかRTLとかRTL生成ツールとか書く生活をしたい。
学生氏の研究成果があまりに革命的なので色々考える。
Intel Names Jaguar Shores as its Next-generation AI Chip -- 今アナウンスする AI プロセッサは中身がなんであれ LLM 推論用であるとみんないうと。
こっちだと Gaudi 3 も推論用みたいなことが書いてある。
Gaudi 3 って、今時珍しく巨大な行列乗算器があってメモリバンド幅がオンチップさえ低いアーキテクチャで、バッチサイズものすごく大きくしないと H100に負けるって公式資料に書いてあってなかなかつらい。
まあ計算機ってなにかしら物理で殴るところがないと数の力で勝つしかないからねえ、、、(CPUはマイクロアーキテクチャの差に意味があるけどアクセラレータはもちろん駄目なアーキテクチャはあるけどそこまで駄目でないとあとは物理)
DRAM 3 次元実装についての牧野の19年前の文章
ここでは「今後可能性があるのは貫通配線を使って別に作った論理 LSI とメモリ LSIを非常に沢山の配線でつなぐ技術でしょう。これは沢山のメーカー、大学その他で活発に研究されており、向こう数年くらいで実用化が進むものと思います。」と書いてる。
まあ実際には Wide I/O は死んで、ある意味折衷案である HBM がでてきたわけで、実用化が進むというのは半分はあたっているけど半分は外れた。
で、ようやくプロセッサダイの上に 3D 積層 DRAM を載せる時代がくる、と私は確信しているわけだけど、どうなるかな。
ついで、 embedded DRAM は成り立たない、DRAM プロセスでの PiM も×、と書いてあってこれは今もその通り。
3Dは熱の問題をいう人が多いんだけど、これはマイクロバンプ(CoC/CoW)に固有の問題でハイブリッドボンディング(WoW)では問題にならないということは知っていてもいいと思う。
マイクロバンプは要するに 20um くらいのハンダボールで2枚のウェファの電極をつなぐわけで(最近は5umとかいう話もあるけど)、これはウェファの間の隙間を樹脂で埋める。樹脂なので熱伝導率が低くて、これが問題になる。
SK Hynix は競合他社よりここの熱伝導率が高い技術をもってて、なので高クロックができるということらしい。これはでもメモリだけでも大変発熱するということでもある。
ところが、ハイブリッドボンディングでは接合される絶縁層は元々ある SiO2 なので、薄い上に熱伝導率が大きい。熱伝導率が3-4倍で厚さが半分とか。なので、マイクロバンプで1層と、ハイブリッドボンディングで8層が同じくらいの熱抵抗になる。
Marvell Custom HBM Compute Architecture for Custom Hyper-Scale XPUs -- HBM4 があまりに熱とダイ面積食うので、我々ならもっと上手くやれるよという Marvellの提案。
まあこれはそうなんだけど、JEDEC 標準にならないとなかなか難しいよね、、、

2024/12/10

pdftk の使い方メモ。時計回り90度回転。 pdftk foo.pdf cat 1-endeast output bar.pdf
学籍番号順ソート sort --key=1.1,1.2 --key=1.4
あああ、色々昨日とか今日してないといけなかったことができてない。
台湾から ANA ので羽田に移動中なんだけど、ネットワークがクレジットカード番号いれてクリックしたところから先に進まない。これで金だけとられてつながらないままとかって大変ありそうではある。

2024/12/9

教授の雑用量に大きな影響があるのが「学科ないし教室の教授の数」である。これは、雑用には学科であればサイズに無関係に存在するものが多いことによる。駒場みたいに教授2人の教室とかあると本当に大変そうである。
10人くらいいると定年まだ学科長回ってこないとか、こいつは危ないから学科長止めとこうとかあるけど、2人とか3人だとそうはいかないしね。

2024/12/8

オランダ人1号氏も還暦か。来年5月に研究会だそうで。
Amazon、AI半導体「学習用」に専念　推論用の開発終了 -- これは、旧来の「推論チップ」が少なくともクラウドでは意味をなさなくなったという話だと思う。
今「推論」といえば LLM 推論なわけで、これはものすごくメモリ量と計算パワー、特にメモリバンド幅を使う。これには、学習用をダウングレードしたみたいな「推論用」チップは役に立たない。
まあ、LLM 推論って B/F が重要みたいな本当に恐ろしい世界で、これに HBM3e とか 4 で対応しようとして死にそうになってるのが今の GPU なんだけど、これは HBMx 使う限りどんな設計しても同じ問題が起こる。
もちろん、GDDRx とか LPDDRx とかではもっとエネルギー消費増えて問題は悪化する。
なので 3D 積層に、というのがもちろん我々の主張なんだけど、じゃあ積層なら問題は全て解決するかというとそうでもない。
一つはチップ内同期の問題で、LLM 速く動かそうと思うとサブマイクロで同期とか通信できないと厳しいのは段数と計算内容評価すればわかる。明示的に同期しないようにしても問題があるのは同じ。
もうひとつはチップ内データ移動の問題で、階層キャッシュや物理共有メモリをもつと、水平方向のデータ移動が長いためデータアクセスエネルギーが下がらない。
LLM 推論ははアプリケーションの性質としては基本的に密行列ベクトル積で、 B/F が小さくてアクセスの局所性もない、キャッシュとかメモリ階層がほぼ無意味なアプリケーションなので。
まあ、我々の主張としては MN-Core L1000 はその辺の全ての問題を解決したということで、ほんまかいなという気もするがどうも本当に解決していそうである。
おそらく問題なのは、 3D積層 DRAM は disruptive technology で、そのポテンシャルを引き出すためには今までのエコシステムを捨てる必要がある、ということ。
例えば IBM のハードウェアビジネスはメインフレームと共に終わり、Intel の半導体ビジネスも x86 アーキテクチャと心中しようとしているんだけど、GPUアーキテクチャはどこにいくのか？という。

2024/12/5

大変久しぶりの講義+演習。ふうう、、、
The Secrets of Consulting – Listing of Laws, Rules and Principles ジェラルド・ワインバーグの「コンサルタントの秘密」にある法則の原語でのリスト。
Google Slides で資料作って pptx にしたら 45MBになったんだけど、資料提出しといてねというサイトは 10MB 上限だった。PDF にしたら 5MBになったのでとりあえずそれでだした。
大学定員、学部生減らし院生増やす　研究拠点校を対象に -- それって、えーと、「大学院重点化」というやつ？つぎにくるのはポスドク1万人計画？

2024/12/4

あ、明日が〆切の講演スライド、英語って書いてある。これ発表日本語なんだよね、、、

2024/12/3

週末にやっておきたかったことが 5/6 終了した。あとは来週の講演資料。SEMICON JAPAN でなんか話をしないといけないことになっている。 12/12 15:30。

2024/12/2

インテル･サムスン、受託生産の誤算　半導体ビッグ3崩れ -- インテルはそもそもファブ成り立ってたっけ問題が、、、現状ファブの売り上げはUMCのほうが大きいよね。
我が社的には Samsung はともかく死なないで欲しい。
スパコンやAI支える「3.5D」半導体、AMDがエヌビディア対抗で先鞭 -- 皆様そちらに進んでて下さい的。
関電の美浜発電所３号機１次系冷却水クーラ海水系統戻り母管の調査状況2024/10/29。これ結構アレではない？ポリエチレンのライニングがはがれたところを 2023/10 にエポキシで補修したらその補修が全部はがれて減肉して穴があいたと書いてあるようにみえる。

2024/12/1

12月である。
大変である。なんかこればっかり。
今日の予定を何故か来週だと勘違いしてた。すみません。
そういうわけで土日でしないといけなかったことの4割くらいしかできてない、、、

牧野のホームに戻る