#optimization

AI News Jul 10, 2026 1 min read

AlphaEvolve GA 전환, 물류·칩·HPC 최적화가 Google Cloud 상품으로

Google의 알고리즘 탐색 agent AlphaEvolve가 Gemini Enterprise Agent Platform에서 일반 제공으로 풀렸다. BASF의 supply-chain digital twin, Coolblue의 28일 수요예측 5% 개선, FM Logistic의 창고 동선 10.4% 개선처럼 실제 최적화 숫자가 함께 나왔다.

#google-cloud #gemini #agents

LLM Reddit Apr 16, 2026 1 min read

VRAM에 자주 쓰는 expert만 올리자, LocalLLaMA가 본 27% 속도 향상

LocalLLaMA가 반응한 이유는 큰 MoE model을 작은 VRAM에서 굴릴 때 생기는 병목을 꽤 현실적인 방식으로 찔렀기 때문이다. 작성자는 Qwen3.5-122B-A10B에서 최근 token들이 자주 route한 expert를 VRAM cache에 올리는 llama.cpp fork를 실험했고, 같은 22GB대 VRAM 사용량에서 layer-based offload보다 token generation이 26.8% 빨랐다고 공유했다.

#local-llm #llama-cpp #moe

LLM Reddit Apr 16, 2026 1 min read

LocalLLaMA가 꽂힌 자동 튜닝, Qwen3.5-27B가 40 tok/s까지 올랐다

LocalLLaMA가 반응한 포인트는 “LLM이 스스로 빨라진다”는 농담 같은 구조가 실제 benchmark 숫자로 이어졌다는 점이었다. 작성자는 llm-server v2의 --ai-tune이 llama-server help를 context로 읽고 flag 조합을 돌며 fastest config를 cache한다고 설명했고, Qwen3.5-27B Q4_K_M은 18.5 tok/s에서 40.05 tok/s까지 올라갔다고 공유했다.

#local-llm #llama-cpp #optimization

LLM Hacker News Apr 10, 2026 1 min read

논문과 경쟁 코드를 먼저 읽는 에이전트, Hacker News가 본 실전 성능 개선

Hacker News에서 주목한 SkyPilot 글은 coding agent가 코드를 건드리기 전에 논문과 경쟁 구현을 읽도록 하면 llama.cpp CPU inference 최적화 품질이 실제로 올라간다고 주장했다. 4대의 cloud VM과 약 29달러 비용으로 TinyLlama 1.1B 기준 x86 text generation을 15%, ARM을 5% 끌어올렸다는 점이 핵심이다.

#coding-agents #llama-cpp #skypilot

AI Hacker News Apr 2, 2026 1 min read

Hacker News가 주목한 Meta의 BOxCrete, 미국산 concrete mix 설계에 AI 적용

Hacker News는 2026년 3월 30일 공개된 Meta의 BOxCrete를 산업용 AI 적용 사례로 다시 끌어올렸다. 이 글은 optimization model, 공개 데이터, 그리고 미국 내 소재 조달이라는 목표가 concrete 설계 문제에서 어떻게 결합되는지를 보여준다.

#meta-ai #construction #concrete

AI Reddit Mar 20, 2026 1 min read

r/MachineLearning, Clip to Grok 실험 주목... 단순한 weight norm clipping으로 grokking 지연 단축 주장

2026년 3월 17일 r/MachineLearning에 올라온 Clip to Grok 글은 크롤링 시점 기준 56점과 20개 댓글을 기록했다. 작성자들은 optimizer step마다 decoder weight row를 L2 clipping하는 방식으로 modular arithmetic benchmark에서 18배에서 66배 빠른 generalization을 얻었다고 주장한다.

#grokking #optimization #transformers

AI Hacker News Mar 19, 2026 1 min read

Hacker News가 주목한 agent-sat, MaxSAT 풀이를 스스로 개선하는 자율 AI 시스템

2026년 3월 19일 Hacker News에서 주목받은 agent-sat는 weighted MaxSAT benchmark를 상대로 스스로 실험과 코드 수정을 반복하는 오픈소스 프로젝트다. README 기준으로 2024 MaxSAT Evaluation 229개 인스턴스 중 220개를 풀었고, 5개는 대회 최고 기록을 넘어섰으며, 1개는 novel solve라고 주장한다.

#agents #maxsat #optimization

LLM Reddit Mar 13, 2026 1 min read

r/singularity, LM head가 학습 신호 대부분을 낭비한다고 보는 논문에 주목

한 Reddit 스레드는 arXiv 논문 2603.10145를 끌어올렸고, 이 논문은 language model의 output layer가 단순한 softmax expressivity 문제가 아니라 gradient norm의 95~99%를 억제하는 optimization bottleneck일 수 있다고 주장한다. 토론은 더 나은 head 설계가 LLM 학습 효율을 크게 바꿀 수 있는지에 집중됐다.

#backpropagation #lm-head #optimization

LLM Hacker News Mar 5, 2026 1 min read

NanoGPT Slowrun 토론 확산, 고정 데이터 조건의 LLM 학습 효율 실험 주목

2026년 3월 4일 HN에서 Q Labs의 Slowrun 벤치마크가 주목을 받았다. 100M FineWeb tokens를 고정한 채 compute를 활용해 data efficiency를 끌어올리는 접근이 핵심이다.

#nanogpt #data-efficiency #llm-training

Gaming Reddit Feb 18, 2026 1 min read

r/Games: LEGO Batman: Legacy of the Dark Knight 권장 RAM 32GB에서 16GB로 하향

LEGO Batman: Legacy of the Dark Knight의 Steam News 공지에서 권장 PC 메모리가 32GB에서 16GB로 조정됐으며, 출시 전까지 스펙은 최종본이 아니라고 명시했다.

#lego-batman #pc-specs #steam

Gaming Reddit Feb 15, 2026 1 min read

r/pcgaming: LEGO Batman: Legacy of the Dark Knight 권장 RAM 32GB→16GB 하향

r/pcgaming 스레드(723점, 댓글 118)는 Steam 공식 공지(PC System Specs Update)를 근거로 LEGO Batman: Legacy of the Dark Knight의 권장 RAM이 32GB에서 16GB로 조정됐고, 사양은 아직 최종이 아니라고 전했다.

#pc-gaming #system-requirements #lego-batman

LLM Reddit Feb 15, 2026 1 min read

llama.cpp Qwen3Next 그래프 최적화 PR 병합, LocalLLaMA에서 추론 속도 개선 확인

r/LocalLLaMA 인기 글은 llama.cpp PR #19375 병합 소식을 공유하며 Qwen3Next 추론 성능 향상을 집중 조명했다. PR 설명과 커뮤니티 벤치마크 모두에서 불필요한 copy 감소에 따른 t/s 개선이 보고됐다.

#llama-cpp #qwen3next #inference