Hacker Newsが注目した Nanocode、約200ドルで Claude Code 風 model を訓練する JAX・TPU blueprint
Original: Nanocode: The best Claude Code that $200 can buy in pure JAX on TPUs View original →
Hacker NewsはNanocodeを、hyperscaler級の予算なしでもClaude Code風のcoding model pipelineを追体験できる珍しい設計図として取り上げた。READMEによれば、このprojectはtokenizer training、pretraining、synthetic data generation、agentic supervised fine-tuning、Constitutional AIベースのalignment、DPOまでをpure JAXでまとめたend-to-end libraryで、主なtargetはTPU環境だ。
HNで特に目立ったのはeconomicsである。READMEは1.3B parameterのnanocode-d24をTPU v6e-8で約9.3時間、約200ドルで再現できると説明している。さらに小さいd20は477M parameterで約34ドル、d12は135M parameterで約3ドルだという。consumer laptop向けの数字ではないが、「big labしか試せない」から「infraを扱える小さなteamでも本格的なexperimentができる」へ会話を動かすには十分な数字だ。
このrepositoryが面白いのは、base model trainingだけで終わらない点だ。coding rollout、tool use、long-context scenario、preference optimization、CLI agentまで含まれており、複数のcoding instruction datasetを取り込んだうえでcritiqueやrestyleの段階を加え、単なるnext-token predictionではなくagent-like behaviorへつなげようとしている。
もちろんcaveatも明確だ。author自身が、NanocodeはTPU向けに最適化されており、Google Cloudの設定、TPU VMへのSSH、JAXのtuningを前提にしていると説明している。one-click productではなくresearch-grade workflowだ。それでも価値があるのは、APIの背後に隠れたblack boxではなく、coding modelを訓練・評価・整列させる実際のmoving pieceを見せてくれるからだ。
元のHNスレッドはnews.ycombinator.com/item?id=47649742、実装はNanocode repositoryで読める。「open agent training」が実務ではどんな形になるのかを知りたい人にとって、いまcommunityに出ている中でもかなり具体的なblueprintの一つだ。
Related Articles
OpenCode は Hacker News で 1,238 points と 614 comments を集めた。project site は、terminal・IDE・desktop をまたぐ open source AI coding agent として、75+ providers、LSP integration、multi-session workflow、privacy-first 設計を前面に出している。
Hacker News の Show HN 投稿で、8.7M parameters、60K の合成会話データセット、Colab notebook を備えた GuppyLM が話題になった。狙いは性能競争ではなく、LLM の学習工程をブラックボックスではなく学べる形で見せることにある。
Lemonadeは GPU・NPU向けの OpenAI-compatible serverとして local AI inferenceをまとめ、everyday PCで open modelを導入しやすくすることを狙う。
Comments (0)
No comments yet. Be the first to comment!