#rocm

AI Hacker News Apr 13, 2026 1 min read

Hacker News가 끌어올린 AMD ROCm 전략: CUDA moat를 넘기 위한 'one step after another'

Hacker News front page에 오른 EE Times 인터뷰는 AMD가 ROCm, Triton, OneROCm, open-source 전략으로 CUDA 의존도를 단계적으로 낮추려는 접근을 정리한다. 핵심은 화려한 호환성 선언보다 vLLM과 SGLang이 자연스럽게 돌아가는 boring한 software 완성도다.

#rocm #cuda #amd

LLM Reddit Mar 23, 2026 2 min read

LocalLLaMA, Mi50에서 ROCm 7과 Vulkan을 비교한 llama.cpp 벤치마크 공유

r/LocalLLaMA의 Mi50 벤치마크 글은 llama.cpp에서 ROCm 7 nightly와 Vulkan을 비교하며, 짧은 문맥에서는 Vulkan이 강하지만 긴 문맥과 MoE에서는 ROCm이 앞선다는 관찰을 제시했다.

#llama.cpp #rocm #vulkan

LLM Reddit Mar 8, 2026 1 min read

LocalLLaMA가 공유한 llama.cpp 튜닝 팁, 작은 n_ubatch가 Qwen 27B prompt processing를 크게 끌어올렸다

LocalLLaMA의 한 글은 RX 9070 XT에서 llama.cpp `--ubatch-size`를 64로 낮췄더니 Qwen3.5-27B의 prompt processing 속도가 크게 뛰었다고 보고했다. 핵심은 64가 만능값이라는 것이 아니라, prompt ingestion과 token generation이 `n_ubatch`에 전혀 다르게 반응할 수 있다는 점이다.

#llama.cpp #qwen #rocm