LLM Reddit Feb 25, 2026 2 min read
r/singularity에서 공유된 METR 후속 글은 2025년 “AI 사용 시 20% 감속” 결과 이후, 최신 도구 환경에서는 생산성 효과가 달라질 수 있음을 보여준다. 다만 연구팀은 강한 선택 편향 때문에 정밀한 추정은 어렵다고 명확히 밝혔다.
r/singularity에서 공유된 METR 후속 글은 2025년 “AI 사용 시 20% 감속” 결과 이후, 최신 도구 환경에서는 생산성 효과가 달라질 수 있음을 보여준다. 다만 연구팀은 강한 선택 편향 때문에 정밀한 추정은 어렵다고 명확히 밝혔다.
Claude Opus 4.6이 METR의 소프트웨어 작업 벤치마크에서 50% 완료 시간 기준으로 약 14.5시간을 달성해 모든 예측을 뛰어넘었습니다. 배가 시간이 3개월 미만으로 측정되며 AI 역량이 지수적으로 성장하고 있음을 보여줍니다.
OpenAI 연구원 Noam Brown이 METR 벤치마크에서 보이는 놀라운 AI 진보 속도에 대해 "이 속도가 계속될 것"이라 답했으며, 연말쯤에는 METR이 그 수준의 시간 범위를 측정하기 어려워질 것이라 전망했다.