#gpu

AI 5d ago 1 min read

Google、SpaceXに月$920M…11万GPUを借りるAI計算力争奪

Googleは2026年10月から2029年6月まで、約110,000基のNVIDIA GPUなどを使うためSpaceXに月$920Mを支払う。Gemini Enterpriseの需要が想定を上回り、巨大インフラ企業でも外部computeを借りる局面に入った。

#google #spacex #ai-compute

LLM Reddit May 28, 2026 1 min read

GLM-5.1 inference改善、鍵はGPUではなくnetwork topology

LocalLLaMAで注目されたのは、同じGPU・同じmodel・同じsoftware stackのまま、throughput 15%増とfirst-token P99 latency 40.6%減を主張した点だった。

#inference #networking #gpu

Sciences X/Twitter May 25, 2026 1 min read

ZOZOの接触ソルバー、GPUで1.8億接点を扱うオープン物理基盤として公開、導入課題も焦点に浮上へ

ZOZOが布・ロープ・軟体向けの接触ソルバーを公開した。単一シーンで1.8億超の接点を扱い、BlenderアドオンとApache 2.0ライセンスも備える。

#simulation #opensource #zozo

LLM Reddit May 22, 2026 1 min read

12GB VRAMでQwen3.6 35BをIk_llama.cppで110 tok/s達成

LocalLLaMAコミュニティユーザーがRTX 4070 Super 12GBでQwen3.6 35B A3BモデルをIk_llama.cppフォークを使用して110トークン/秒で実行することに成功しました。CPU オフロード最適化に優れたこのフォークは標準llama.cppより大幅に高いパフォーマンスを示しました。

#llama-cpp #qwen #local-llm

Gaming Reddit May 18, 2026 1 min read

PC ゲーマーの60%が今後2年間の新規ビルド計画なし—AIによる部品価格高騰が市場を直撃

Tom's Hardwareの調査によると、PC ゲーマーの60%が今後2年間で新しいPCを自作する計画がないことが判明。AI需要によるRAM価格の急騰が熱心なゲーマー市場を事実上麻痺させている。

#pc-gaming #hardware #ram

Gaming Reddit May 14, 2026 1 min read

AMD FSR 4.1、RX 7000シリーズに7月正式対応—RX 6000は2027年

AMDがFSR（FidelityFX Super Resolution）アップスケーリン4.1をRadeon RX 7000シリーズへ2026年7月に正式対応すると発表。RX 6000シリーズへの対応は2027年の予定。

#amd #fsr #upscaling

Gaming Reddit Apr 29, 2026 1 min read

GALAX旧体制を終了、Palitが運営とRMAを引き継ぎ

4月29日の共同声明によると、GALAX関連の運営と顧客対応は今後Palitの公式チャネルが担当する。既存ユーザーの保証やRMA窓口もPalitへ移る。

#galax #palit #gpu

AI Hacker News Apr 20, 2026 1 min read

WasmからGPUへのzero-copy inference、HNは速度差の実体を問うた

HNがこのpostを面白がった理由は、Apple Silicon unified memoryでWasm sandboxとGPU bufferが本当に同じbytesを扱えるのかという実装上の境界だった。

#wasm #gpu #inference

AI X/Twitter Apr 18, 2026 1 min read

Cloudflare Unweight、Llama bundleをlosslessに最大22%削るGPU kernelを公開

重要なのは、CloudflareがLLM servingの制約をGPU台数ではなくmemory-bandwidthの問題として扱っている点だ。記事はLlama 3.1 8Bで15-22%のmodel-size reduction、約3GBのVRAM削減、公開GPU kernelsを示した。

#cloudflare #llm-inference #gpu

AI Apr 14, 2026 1 min read

Hugging Face、HubでGPU kernel配布を簡略化し最大2.5倍高速化

Hugging Faceは最適化GPUコードをHub-native artifactとして扱い、PyTorch運用で最も厄介な配布工程を薄くしようとしている。Clement Delangueによれば、新しいKernelsフローはGPU、PyTorchビルド、OSに合わせたprecompiled binaryを配り、PyTorch baseline比で1.7倍から2.5倍の高速化を狙う。

#hugging-face #kernels #pytorch

AI Hacker News Apr 13, 2026 1 min read

Hacker Newsで浮上したAMDのROCm戦略: CUDAのmoatを崩すための“one step after another”

Hacker Newsのfront pageに上がったEE Times interviewは、AMDがROCm、Triton、OneROCm、open-sourceの運用でCUDA依存を段階的に削ろうとしていることを整理している。重要なのは派手な互換性宣言ではなく、vLLMやSGLangが自然に動くboringなsoftware完成度だ。

#rocm #cuda #amd

AI Reddit Apr 11, 2026 1 min read

Redditが指摘したRTX 5090のバッチFP32 workloadにおけるcuBLAS性能異常

MachineLearningコミュニティの投稿は、RTX 5090でcuBLASがbatched FP32 MatMulに非効率なkernelを選んでいる可能性を指摘する。重要なのは、単なる不満ではなく、再現可能なbenchmark表とprofiling情報を伴うdispatch問題の提起になっている点だ。

#cublas #rtx-5090 #cuda