2026년 3월 4일 HN에서 Q Labs의 Slowrun 벤치마크가 주목을 받았다. 100M FineWeb tokens를 고정한 채 compute를 활용해 data efficiency를 끌어올리는 접근이 핵심이다.
#optimization
LEGO Batman: Legacy of the Dark Knight의 Steam News 공지에서 권장 PC 메모리가 32GB에서 16GB로 조정됐으며, 출시 전까지 스펙은 최종본이 아니라고 명시했다.
r/pcgaming 스레드(723점, 댓글 118)는 Steam 공식 공지(PC System Specs Update)를 근거로 LEGO Batman: Legacy of the Dark Knight의 권장 RAM이 32GB에서 16GB로 조정됐고, 사양은 아직 최종이 아니라고 전했다.
r/LocalLLaMA 인기 글은 llama.cpp PR #19375 병합 소식을 공유하며 Qwen3Next 추론 성능 향상을 집중 조명했다. PR 설명과 커뮤니티 벤치마크 모두에서 불필요한 copy 감소에 따른 t/s 개선이 보고됐다.
r/LocalLLaMA 인기 글은 llama.cpp PR #19375 병합 소식을 공유하며 Qwen3Next 추론 성능 향상을 집중 조명했다. PR 설명과 커뮤니티 벤치마크 모두에서 불필요한 copy 감소에 따른 t/s 개선이 보고됐다.
2026년 2월 13일 r/LocalLLaMA 게시글이 DMS(Dynamic Memory Sparsification)로 KV 캐시 메모리를 최대 8배 줄이면서 정확도를 유지할 수 있다는 내용을 공유했다. 커뮤니티는 추론 비용과 동시성 개선 가능성에 주목했지만, 1차 출처 검증 필요성도 함께 제기했다.
Unsloth가 커스텀 Triton 커널과 수학 최적화를 통해 Mixture of Experts (MoE) 모델 학습을 12배 가속화하고 VRAM 사용량을 35% 이상 줄였습니다. RTX 3090 같은 소비자용 GPU에서도 대형 모델 fine-tuning이 가능합니다.
Mistral AI의 Voxtral Realtime 4B 음성인식 모델을 순수 C 언어로 구현한 voxtral.c가 공개되었습니다. Python이나 CUDA 없이 C 표준 라이브러리만으로 실행되며, Apple Silicon에서는 실시간보다 2.5배 빠른 속도로 음성을 텍스트로 변환할 수 있습니다. 메모리 맵핑 방식으로 '거의 즉시' 로딩되며, 무제한 길이의 오디오를 1.8GB 메모리로 처리할 수 있습니다.