Hacker News가 주목한 Nanocode, 약 200달러로 Claude Code 스타일 model을 훈련하는 JAX·TPU 청사진
Original: Nanocode: The best Claude Code that $200 can buy in pure JAX on TPUs View original →
Hacker News는 Nanocode를 hyperscaler급 예산 없이도 Claude Code 스타일의 coding model pipeline을 따라가 볼 수 있는 드문 설계도로 끌어올렸다. README에 따르면 이 project는 tokenizer training, pretraining, synthetic data generation, agentic supervised fine-tuning, Constitutional AI 기반 alignment, DPO까지를 pure JAX로 묶은 end-to-end library이며, 기본 target은 TPU 환경이다.
HN에서 특히 눈에 띄는 지점은 economics다. README는 1.3B parameter 규모의 nanocode-d24를 TPU v6e-8에서 약 9.3시간, 약 200달러 수준으로 재현할 수 있다고 설명한다. 더 작은 configuration인 d20은 477M parameter에 약 34달러, d12는 135M parameter에 약 3달러 수준으로 제시된다. consumer laptop 실험은 아니지만, “이건 big lab만 할 수 있다”에서 “infra를 다룰 수 있는 작은 팀도 serious experiment를 해볼 수 있다”로 대화를 이동시키는 숫자다.
이 repository가 흥미로운 이유는 base model training에 멈추지 않기 때문이다. coding rollout, tool use, long-context scenario, preference optimization, CLI agent까지 들어 있고, 여러 coding instruction dataset을 가져온 뒤 critique와 restyle 단계를 추가해 agent-like behavior로 이어지는 pipeline을 만든다. 단순 next-token prediction이 아니라 coding agent를 만드는 과정을 가능한 한 드러내려는 시도에 가깝다.
물론 caveat도 분명하다. author는 Nanocode가 TPU에 최적화돼 있고, Google Cloud 설정과 TPU VM SSH, JAX tuning을 전제로 한다는 점을 숨기지 않는다. one-click product라기보다 research-grade workflow다. 하지만 바로 그 점 때문에 오히려 가치가 있다. API 뒤에 가려진 black box가 아니라, coding model을 훈련하고 평가하고 정렬하는 실제 moving piece를 보여 주기 때문이다.
원문 HN 토론은 news.ycombinator.com/item?id=47649742에 있고, 구현은 Nanocode repository에 정리돼 있다. “open agent training”이 실제로 어떤 모습인지 알고 싶은 사람에게 지금 community에 떠도는 가장 구체적인 blueprint 중 하나다.
Related Articles
MinishLab이 공개한 Semble은 AI 에이전트가 코드베이스를 탐색할 때 소모되는 토큰을 grep+read 방식 대비 98% 줄이는 오픈소스 코드 검색 라이브러리다. Claude Code, Cursor 등 주요 AI 코딩 플랫폼에서 MCP 서버로 즉시 활용 가능하며, NDCG@10 기준 변환기 모델의 99% 품질을 CPU만으로 달성했다.
ACM CAIS '26에 발표된 오픈소스 Python 프레임워크 Forge가 Ministral-3 8B 모델에 가드레일을 적용해 에이전트 작업 정확도를 53%에서 99%로 향상시켰다.
Alibaba Qwen 팀이 에이전트 중심 설계의 신모델 Qwen3.7-Max를 공개했다. Artificial Analysis 평가에서 GPT 5.4와 동급인 5위를 기록하며 오픈 웨이트 프론티어 모델의 새 기준을 제시했다.
Comments (0)
No comments yet. Be the first to comment!