Skip to content

#claude

RSS Feed
AI Apr 26, 2026 1 min read

선거 시즌 AI 안전은 선언보다 숫자가 더 중요해지고 있다. Anthropic는 2026년 4월 24일 Claude의 선거 관련 테스트 결과를 공개하며, 600개 프롬프트 평가에서 Opus 4.7과 Sonnet 4.6이 각각 100%와 99.8%로 대응했고, 영향력 공작 시뮬레이션에서도 90%와 94%의 적절한 응답 비율을 기록했다고 밝혔다.

LLM Hacker News Apr 18, 2026 1 min read

HN이 주목한 건 Claude 4.7의 성능표가 아니라, 같은 prompt가 더 많은 token으로 계산될 때 developer workflow의 실제 비용이 어떻게 바뀌느냐였다. 원문은 Anthropic의 1.0-1.35x 안내보다 일부 technical docs에서 높은 ratio를 측정했고, 댓글은 token price보다 task value와 human review 시간이 더 중요하다는 반론까지 붙었다.