Valve engineer Natalie VlockのLinux VRAM optimizationは、VRAM不足時にforeground gameを優先する。TweakTownはRX 6500 XTテストで、Alan Wake IIが1080p low、FSR Quality条件で14 FPSから41 FPSへ上がったと報じた。
#performance
RSS FeedLocalLLaMAがこのmergeに反応したのは、すぐ試せるからだ。ただしthreadの有益なcaveatは、speedupがpromptの反復性とdraft acceptanceに大きく依存する点だった。
r/MachineLearningの投稿とリンク先のbenchmark記事は、RTX 5090のbatched FP32 SGEMMが非効率なcuBLAS経路に入り、GPU計算資源を大きく余らせていると主張する。
Tom’s Hardwareによると、RPCS3開発陣はPlayStation 3のCell CPUにおける新しいSPU利用パターンを見つけ、より効率的な再コンパイル経路を追加した。Twisted Metalでは最近のビルド間で平均FPSが5%から7%伸び、効果は全ゲームに及ぶとしている。
TechSpotは、最新のSteamクライアントコードから他ユーザーのフレームレート実績を基にした推定FPSチャートの文言が見つかったと報じた。正式実装されれば、曖昧な推奨環境よりも実感に近い購入前情報として機能しそうだ。
2026年3月25日、Recoの`gnata`記事を扱ったHacker News投稿は、クロール時点で256 pointsと237 commentsを集めた。RecoはJSONata 2.xをGoへ移すAI-assisted作業が約7時間と400ドルのtoken costで始まり、RPC中心のNode fleet撤去と後続refactorを通じて年50万ドル規模の削減につながったと主張している。
Gearboxと2Kは、3月26日の<em>Borderlands 4</em> patchでPC平均FPSを約20%押し上げ、crashとstutterも減らしたと説明した。
LocalLLaMAの投稿は、RX 9070 XT上でllama.cppの`--ubatch-size`を64まで下げたところ、Qwen3.5-27Bのprompt processingが大きく高速化したと報告した。重要なのは64が万能値だということではなく、prompt ingestionとtoken generationが`n_ubatch`に全く異なる反応を示しうる点だ。
LocalLLaMAのコミュニティメンバーが、NVLink接続の2x RTX 3090環境でQwen3.5 27Bを170kコンテキストで100+ t/sのデコード速度と、8同時リクエストで585 t/sのスループットを達成した方法を共有した。
Ollama 0.17が2月22日にリリース。llama.cppサーバーモードに代わる独自推論エンジンを導入し、NVIDIA GPUでプロンプト処理最大40%、トークン生成18%の高速化を実現。マルチGPUテンソル並列処理の改善とAMD RDNA 4サポートも追加。
研究者が15のLLMのコーディング性能を単一の変更で劇的に改善した。モデルではなく編集ツールを再設計することで、Grok Code Fastの成功率が6.7%から68.3%へ10倍向上した。
Digital Foundryのテストにより、Resident Evil 4 Remake PC版に追加された新しいDRMがCPU性能に悪影響を与えることが確認された。