#vram

RSSフィード

LLM Reddit May 31, 2026 1 min read

llama.cppのRDNA3向けFlash Attention、local LLMのVRAM制約に一手

LocalLLaMAで注目されたのは実用的な数字だ。RDNA3環境でKV VRAMを47%減らすという報告は、CUDA外のlocal inference利用者に直結する。

#llamacpp #rdna3 #flash-attention

LLM Reddit Apr 28, 2026 1 min read

16GB VRAMの抜け道か　LocalLLaMAが出した「古いGPUを足す」現実策

LocalLLaMAがこの投稿に反応した理由ははっきりしていた。27B modelを二枚の不揃いGPUのVRAM内へ押し込めるなら、遅い補助カードでもsystem RAMへあふれるよりましだという、かなり実務的な主張だったからだ。

#local-llms #vram #multi-gpu

Gaming Reddit Apr 22, 2026 1 min read

ValveのLinux VRAM patch、RX 6500 XTでAlan Wake IIを14→41 FPSに改善

Valve engineer Natalie VlockのLinux VRAM optimizationは、VRAM不足時にforeground gameを優先する。TweakTownはRX 6500 XTテストで、Alan Wake IIが1080p low、FSR Quality条件で14 FPSから41 FPSへ上がったと報じた。

#valve #linux #vram

LLM Reddit Apr 22, 2026 1 min read

llama.cpp --fitでLocalLLaMAがVRAMの壁を再計算

LocalLLaMAが反応したのは新model自慢ではなく、--fitが「VRAMに全部入らなければ遅い」という経験則を揺らしたからだ。

#llama-cpp #local-llm #vram

Gaming Reddit Apr 12, 2026 1 min read

Nvidia RTX Neural Texture Compression benchmark、VRAM削減は大きいがperformance costも確認

Tom's Hardwareのtestによれば、Nvidia RTX Neural Texture Compressionはsample sceneでtexture memoryを約85%削減できる。ただし最も攻めたmodeにはperformance costがあり、見た目を安定させるにはDLSSのようなanti-aliasingが事実上重要になる。

#nvidia #rtx #vram

Gaming Reddit Apr 10, 2026 1 min read

Valveのlow-vRAM Linux gaming改善、8GB GPUでの安定動作を狙う

Phoronixによると、ValveのLinux graphics driverチームで働くNatalie Vockが、限られたvideo memory環境でforeground gameを優先するkernelとKDE側の仕組みを公開した。狙いはsystem RAMへのspillを減らし、8GB級GPUでもより安定したLinux gaming体験を作ることにある。

#valve #linux-gaming #vram

LLM Reddit Apr 8, 2026 1 min read

r/LocalLLaMAが押し上げた Gemma 4 ローカル fine-tuning、8GB VRAM ガイドと bug fix

r/LocalLLaMA で広がった Unsloth の Gemma 4 ガイドは、Gemma-4-E2B と E4B を 8GB VRAM でローカル fine-tuning できると訴える。投稿では約 1.5 倍の training speed、FA2 比で約 60% 少ない VRAM、そして初期 Gemma 4 の training・inference bug fix を practical workflow としてまとめている。

#gemma-4 #fine-tuning #local-llm

Gaming Reddit Apr 5, 2026 1 min read

NVIDIA Neural Texture Compression、VRAM 予算の考え方を変え始める

いまr/Gamesで強く反応されている hardware 系の話題は frame generation ではなく memory 圧力そのものだ。NVIDIA の最新 Neural Texture Compression demo は、あるsceneのVRAM使用量を約 6.5GB から 970MB まで落としたと報じられ、NVIDIA自身の開発者向け説明も、より重い texture を現実的な予算に収めるための実用技術としてこれを位置づけている。

#nvidia #vram #neural-texture-compression

LLM Reddit Mar 27, 2026 1 min read

Intel Arc Pro B70、32GB local inferenceの新しいsub-$1,000基準になるか

LocalLLaMAでこの話題が伸びたのは、IntelのGPUニュースを実際のlocal inferenceユーザーが見る指標、つまりVRAM、bandwidth、software support、costへ翻訳したからだ。

#intel #gpu #vram

LLM Reddit Mar 26, 2026 1 min read

Intel Arc Pro B70/B65がLocalLLaMAの本命候補として浮上

r/LocalLLaMAではIntel Arc Pro B70/B65の話題が213 upvotes、133 commentsを集めた。IntelはB70を2026年3月25日から$949 starting priceで提供し、B65はmid-Aprilに投入するとしている。

#intel #gpu #vram

LLM Reddit Mar 16, 2026 1 min read

LocalLLaMAが押し上げたGreenBoost、RAMとNVMeでNVIDIA GPU memoryを拡張するLinux driver

LocalLLaMAで広がったGreenBoostは、limited vRAM問題を回避しようとするexperimentalなLinux kernel moduleだ。2026年3月14日のPhoronix記事によれば、このGPLv2 projectはkernel moduleとCUDA shimを組み合わせ、大きなallocationをon-card vRAMの外にあるpinned system RAMとNVMe tierへ逃がしつつ、CUDA applicationの修正なしにより大きなLLM workloadを走らせることを狙っている。

#nvidia #vram #cuda

Gaming Reddit Feb 26, 2026 1 min read