r/artificialで話題のATLAS、500ドルGPUでLiveCodeBench 74.6%
Original: Open-source AI system on a $500 GPU outperforms Claude Sonnet on coding benchmarks View original →
r/artificialでATLASが話題になったのは、より良いinference infrastructureが想像以上に性能差を縮めうると示しているからだ。project READMEによれば、ATLAS V3は単一のRTX 5060 Ti 16 GB上で、frozenな14B Qwen modelを使い、LiveCodeBench v5で74.6% pass@1を達成した。fine-tuningもなく、API callもなく、cloud inferenceも使っていない。
重要なのは、ATLASが小さなmodel一つで突然frontier model級になったと主張しているわけではないことだ。スコアはpipelineから生まれている。PlanSearchがconstraintを抽出しつつ複数のapproachを生成し、“Geometric Lens”がcandidateを順位付けし、sandboxed executionがそれらを試し、self-verified repair stageが失敗した解答を最終提出前に修正する。READMEでは、このbest-of-3 plus repair processが54.9%のbaselineを74.6%まで押し上げたと説明している。
- repositoryはfrozenな
Qwen3-14B-Q4_K_Mmodelで599件のLiveCodeBench taskに対してこの結果を出したとしている。 - cost estimateはtaskあたり約
$0.004のlocal electricityで、同じtableにあるAPIベースのreference systemよりかなり低い。 - authorsによればtradeoffはlatencyで、難しいtaskではsingle forward passではなくsearch、scoring、repairにcompute budgetを使うため数分単位になることがある。
このtradeoffがあるからこそ、Reddit postは刺さった。多くの“local beats frontier”系の主張はraw model qualityとsystem designの違いを曖昧にしがちだ。ATLASはその点むしろ明確で、base checkpointが隠れた強モデルだと装うのではなく、frozen modelをより賢くorchestrationして勝とうとしている。repositoryもcomparison tableがcontrolled head-to-headではないと明記しており、競合の公開スコアは別task setかつsingle-shot evaluationから来ていると説明している。
その留保を踏まえても、ATLASは興味深いsignalだ。consumer hardware上のcoding systemは、より大きいlocal checkpointだけで進歩する前に、planning、verification、repair loopによってかなり改善する可能性があることを示している。privacy、predictable cost、そしてthird-party APIへdataを出さない運用を重視するteamにとっては特に意味のある流れだ。
一次情報: ATLAS repository。コミュニティ出典: r/artificial thread。
Related Articles
Flash-MoEは、48 GBメモリのMacBook ProでQwen3.5-397B-A17Bを動かすとするC/Metalベースのinference engineだ。209 GBのMoEモデルをSSDからstreamingし、必要なexpertだけを読む設計が中核になっている。
2026年3月17日にr/LocalLLaMAへ投稿されたHugging Face hf-agentsスレッドは、クロール時点で624ポイントと78件のコメントを集めた。このextensionはllmfitでhardwareを検出し、実行可能なmodel/quantを勧め、llama.cppとPi coding agentをつなぐ。
2026年3月17日のr/LocalLLaMAで、hf-agentsの投稿は534 pointsと69 commentsを集めた。このツールはllmfit、llama.cpp、Piをつなぎ、ハードウェア検出からローカルcoding agent起動までを一つの流れにまとめる。
Comments (0)
No comments yet. Be the first to comment!