#pytorch

Hugging Faceは最適化GPUコードをHub-native artifactとして扱い、PyTorch運用で最も厄介な配布工程を薄くしようとしている。Clement Delangueによれば、新しいKernelsフローはGPU、PyTorchビルド、OSに合わせたprecompiled binaryを配り、PyTorch baseline比で1.7倍から2.5倍の高速化を狙う。

#hugging-face #kernels #pytorch

AI X/Twitter Apr 10, 2026 1 min read

PyTorch、Blackwell向けDiffusers・TorchAO quantizationでdiffusion inference高速化を提示

PyTorchは2026年4月8日のXで、DiffusersとTorchAOによるMXFP8/NVFP4 quantizationがNVIDIA B200上のdiffusion latencyを下げられると説明した。併載blogはselective quantizationとregional compilationを実務向けのlatency-memory最適化レシピとして位置づけている。

#pytorch #torchao #blackwell

AI X/Twitter Apr 9, 2026 1 min read

PyTorch Foundation、SafetensorsとHelionをhosted projectに追加

PyTorchは2026年4月9日にXで、SafetensorsとHelionがPyTorch Foundationのfoundation-hosted projectに加わったと発表した。これによりfoundationはmodel distribution safetyと低レイヤーkernel toolingの両方で存在感を強める。

#pytorch #safetensors #helion

LLM Hacker News Apr 7, 2026 1 min read

GuppyLM、LLM学習を読み解ける8.7MパラメータのShow HNプロジェクト

Hacker NewsのShow HNで注目されたGuppyLMは、60Kのsynthetic conversationsと意図的に単純化したtransformer構成でLLM学習の全体像を見せる。Colabとブラウザの両方で試せる教育向けの超小型モデルだ。

#llm #education #pytorch

AI Reddit Mar 17, 2026 1 min read

r/MachineLearning: preflight、label leakageやNaNを学習前に止めるPyTorch pre-training validator

2026年3月15日のr/MachineLearningでは、preflight紹介postが56 points、13 commentsを記録した。lightweightなCLIで、PyTorch training前にlabel leakage、NaN、channel ordering、dead gradients、class imbalance、VRAM riskなど10項目を検査する。

#pytorch #mlops #data-validation

AI Reddit Mar 17, 2026 1 min read

r/MachineLearning: GraphZero、mmapとzero-copy tensorで巨大graphをRAMごと読み込まず扱うC++ engine

2026年3月15日のr/MachineLearningでは、GraphZero v0.2の紹介postが334 points、27 commentsを集めた。postとGitHub READMEは、SSD mmap、custom binary format、nanobind bridgeで100M+ node graphをconsumer hardware上で扱う方法を示している。

#graph-neural-networks #pytorch #c++

LLM Reddit Mar 10, 2026 1 min read

r/LocalLLaMAが注目した自律LLM研究のovernightループ

r/LocalLLaMAで話題のkarpathy/autoresearchは、agentが1つの training file を編集し、5分実験を繰り返しながら val_bpb 改善を狙う小さな open-source 研究ループだ。

#ai-agents #research-automation #pytorch

LLM Reddit Mar 9, 2026 1 min read

Karpathyのautoresearch、AI agentがPyTorch実験を反復する研究ループ

LocalLLaMAで共有された autoresearch は、agent が PyTorch 学習コードを編集し、5分単位の実験を繰り返しながら val_bpb の改善を探索する最小構成の研究フレームワークだ。

#llm #ai-agents #pytorch

#pytorch

Harness Training、agent改善をモデル本体から実行基盤へ移す試み

低VRAM optimizer「Rose」、r/MachineLearningが先に求めたのは実験設計

難解さより手触り、r/MachineLearningが反応した手作り diffusion LM

TorchTPUでHNが見た争点は一つ 「device="tpu"で本当に動くのか」

Hugging Face、HubでGPU kernel配布を簡略化し最大2.5倍高速化