OpenAI, 16MB 제약 아래 효율 pretraining 겨루는 Parameter Golf 공개
Original: OpenAI launches Parameter Golf challenge View original →
OpenAI는 2026년 3월 18일 X를 통해 Parameter Golf라는 새 연구 챌린지를 공개했다. 연결된 안내 페이지에 따르면 참가자는 고정된 FineWeb dataset에서 held-out loss를 최소화해야 하며, 동시에 weights와 training code를 합쳐 16 MB artifact limit를 지켜야 하고, 학습은 8×H100 기준 10분 budget 안에서 끝나야 한다.
이 설계는 단순한 홍보 이벤트라기보다 효율성 자체를 겨루는 실험에 가깝다. 더 큰 모델이나 더 긴 학습 시간을 허용하는 대신, OpenAI는 parameter efficiency, training efficiency, reproducibility를 동시에 최적화하도록 룰을 짰다. edge deployment, compact foundation models, efficient pretraining에 관심 있는 연구자와 엔지니어에게 특히 의미가 큰 이유다.
운영 방식도 공개 engineering benchmark에 가깝다. OpenAI는 baseline, 고정 dataset, evaluation scripts가 포함된 GitHub repo를 제공한다고 밝혔다. 참가자는 이를 fork한 뒤 size·compute 한도 안에서 모델을 개선하고, 코드, logs, score, 짧은 write-up을 담아 PR로 제출하면 된다. 승인되면 leaderboard가 자동으로 갱신되는 구조다.
이번 챌린지는 채용과도 연결된다. OpenAI는 우수 참가자에게 인터뷰 기회를 제공할 수 있고, 우승 접근법은 공개적으로 소개될 수 있다고 설명했다. 또한 공급 상황과 자격 심사를 전제로, Runpod를 통한 quick-start credits부터 고급 competitor grant까지 compute 지원도 마련했다.
더 큰 흐름에서 보면 frontier lab들이 다시 소형 고효율 모델과 그 주변 engineering discipline에 강한 관심을 보이고 있다는 신호다. Parameter Golf는 그 우선순위를 공개 경쟁 형태로 구체화한 사례다. 상위권 결과가 실제로 나오면, leaderboard를 넘어 작은 예산으로 더 많은 능력을 끌어내려는 개발자들에게도 바로 참고할 만한 기법이 나올 가능성이 크다.
Related Articles
OpenAI는 2026년 3월 9일 Promptfoo 인수 계획을 공개하며 해당 AI security tooling을 OpenAI Frontier에 통합하겠다고 밝혔다. enterprise agent 개발에서 security testing, red-teaming, governance를 기본 workflow로 끌어들이려는 움직임이다.
OpenAI는 2026년 3월 11일 AI agent가 읽는 이메일, 웹페이지, 캘린더 초대 같은 untrusted content가 핵심 보안 경계라고 설명하는 새 가이드를 공개했다. 회사는 안전한 agent가 data와 instruction을 분리하고, least privilege를 적용하며, 중요한 action 전에는 monitoring과 user confirmation을 넣어야 한다고 밝혔다.
r/MachineLearning에서는 가중치 변경 없이 중간 7개 층 블록만 복제해 leaderboard 성능을 끌어올렸다는 실험 노트가 큰 관심을 받고 있다.
Comments (0)
No comments yet. Be the first to comment!