Anthropic, 장시간 scientific computing에 맞춘 단일 Claude agent 운영 방식을 공개
Original: R to @AnthropicAI: Models keep improving on long-horizon tasks, but splitting work across many agents doesn’t suit every problem. We walk through the setup for a single agent working sequentially on a task where mistakes compound: modeling the early universe. Read more: https://www.anthropic.com/research/long-running-Claude View original →
Anthropic가 X에서 밝힌 내용
2026년 3월 23일, Anthropic는 long-horizon task의 성능이 좋아지고 있다고 해서 언제나 agent를 더 많이 병렬화하는 것이 정답은 아니라고 설명했다. 회사는 오류가 누적되기 쉬운 문제, 즉 초기 우주를 모델링하는 작업에서는 단일 agent가 순차적으로 작업하는 방식이 더 적합할 수 있다고 강조했다.
이 포인트가 중요한 이유는 최근 agent 담론이 문제를 잘게 쪼개는 방향으로 기울어 있기 때문이다. Anthropic의 메시지는 조금 다르다. 어떤 작업은 앞 단계의 맥락이 뒤 단계를 좌우하기 때문에, 무리한 분할이 오히려 해결 가능성을 떨어뜨릴 수 있다는 것이다.
연구 글이 추가한 정보
연결된 글에서 Anthropic는 multi-day agentic coding workflow를 scientific computing에 적용하는 방식을 설명한다. 구체적인 예시는 Claude Opus 4.6을 사용해 differentiable cosmological Boltzmann solver를 구현하는 과정이다. 이는 광자, baryon, neutrino, dark matter의 결합 방정식을 풀어 Cosmic Microwave Background를 예측하는 종류의 수치 코드다.
Anthropic는 이 사례가 agent 설계의 한계를 잘 보여준다고 본다. 글은 장시간 agent workflow를 쓰면 원래 며칠, 몇 주, 심지어 몇 달 걸릴 프로젝트를 몇 시간 안에 끝낼 수도 있다고 말한다. 다만 scientific code처럼 인과관계가 길게 이어지는 작업에서는 무제한 병렬 분해가 아니라, persistent memory, orchestration pattern, reference implementation, 필요한 순간에만 쓰는 보조 subagent가 더 중요하다고 설명한다.
왜 중요한가
실무적으로 보면 agent engineering이 “agent 수를 늘릴수록 좋다”는 단순 공식에서 벗어나고 있다는 신호다. scientific computing이나 다른 고정밀 영역에서는 전체 workflow의 인과 구조를 유지해야 한다. 시스템은 상태를 오래 보존하고, 알려진 기준 구현과 지속적으로 비교하고, 도메인 제약을 놓치지 않아야 한다.
따라서 이 글은 단순한 Anthropic 내부 운영 팁이 아니다. frontier lab이 scientific software 자체를 장시간 자율 시스템의 실제 적용 대상으로 다루기 시작했다는 구체적 증거다. 이 패턴이 일반화된다면, 논문과 방정식에서 실제 연구 코드까지 가는 시간이 크게 줄어들 수 있다.
Related Articles
Anthropic는 2026년 3월 23일 AI가 연구 관행과 scientific discovery를 어떻게 바꾸는지에 초점을 맞춘 Science Blog를 시작한다고 밝혔다. 새 블로그는 feature story, workflow guide, field note를 통해 Anthropic의 AI-for-science 전략을 더 지속적인 프로그램으로 보여 준다.
Subreddit이 집중한 것은 Anthropic physics case study의 드문 솔직함이었다. Claude는 작업 속도를 끌어올렸지만, fabricated check, 잘못된 formula, 약한 judgment를 잡아내기 위해서는 여전히 expert supervision이 필요했다.
Anthropic는 2026년 2월 25일 Vercept를 인수해 Claude의 computer use capability를 강화한다고 밝혔다. 회사는 이번 거래를 Sonnet 4.6의 OSWorld 72.5% 성과와 live application 안에서 행동하는 agent 전략의 연장선으로 설명했다.
Comments (0)
No comments yet. Be the first to comment!