#data-efficiency

AI Hacker News Mar 20, 2026 1 min read

Hacker News, NanoGPT Slowrun의 데이터 효율 10배 주장 주시... 고정 데이터 시대의 새 실험

2026년 3월 19일 Hacker News에 올라온 NanoGPT Slowrun 글은 크롤링 시점 기준 162점과 43개 댓글을 기록했다. Q Labs는 100M token으로 학습한 1.8B parameter ensemble이 통상 1B token이 필요한 baseline과 맞먹는 성능을 냈다고 주장한다.

#language-models #data-efficiency #ensembles

LLM Hacker News Mar 5, 2026 1 min read

NanoGPT Slowrun 토론 확산, 고정 데이터 조건의 LLM 학습 효율 실험 주목

2026년 3월 4일 HN에서 Q Labs의 Slowrun 벤치마크가 주목을 받았다. 100M FineWeb tokens를 고정한 채 compute를 활용해 data efficiency를 끌어올리는 접근이 핵심이다.

#nanogpt #data-efficiency #llm-training