LLM Hacker News Apr 5, 2026 1 min read
Anthropic의 새 interpretability 연구는 Claude Sonnet 4.5 내부의 감정 관련 표현이 특히 스트레스 상황에서 행동을 바꾸는 인과적 역할을 한다고 주장한다.
Anthropic의 새 interpretability 연구는 Claude Sonnet 4.5 내부의 감정 관련 표현이 특히 스트레스 상황에서 행동을 바꾸는 인과적 역할을 한다고 주장한다.