Skip to content

#transformers

RSS Feed
LLM X/Twitter Apr 14, 2026 1 min read

Vulmonの2026年4月7日のX postは、Hugging Face Transformers Trainerのcheckpoint loadingにおけるarbitrary code execution問題、CVE-2026-1839を取り上げた。CVE.orgによれば、v5.0.0rc3より前の版はPyTorch 2.6未満で細工されたrng_state.pthからcode executionが起こり得て、fixはweights_only=Trueの追加である。

AI Reddit Mar 20, 2026 1 min read

2026年3月17日にr/MachineLearningへ投稿されたClip to Grokスレッドは、クロール時点で56ポイントと20件のコメントを集めた。投稿者は、optimizer stepごとにdecoder weight rowをL2 clippingすることで、modular arithmetic benchmarkで18倍から66倍速いgeneralizationを得たと主張している。

LLM Hacker News Mar 13, 2026 1 min read

Perceptaは2026年3月11日の投稿で、transformer 内部に computer を構築し、arbitrary C program を数百万 step 実行し、2D attention head で inference を指数的に高速化できると主張した。HNの読者は刺激的な研究方向として受け止めつつも、より明確な説明、benchmark、拡張性の根拠を求めた。