AI 연구 자동화가 추상적 위험에서 실험 지표로 이동했다. Anthropic은 Mythos Preview가 최적화 과제에서 약 52배 속도 향상을 냈고, 연구 다음 단계 판단에서도 64% 우위를 보였다고 밝혔다.
#ai-research
RSS FeedOpenAI의 범용 추론 모델이 수학자 폴 에르되시가 1946년에 제시한 기하학 난제를 자율적으로 해결했다. AI가 수학의 주요 미해결 문제를 스스로 풀어낸 최초의 사례로, 외부 수학자들이 증명을 검토하고 검증했다.
OpenAI의 범용 추론 모델이 1946년 폴 에르되시가 제기한 이산 기하학의 핵심 추측을 자율적으로 반증했다. AI가 수학의 주요 미해결 문제를 독립적으로 해결한 것은 역사상 처음이며, 다수의 수학자들이 독립적으로 검증했다.
Google DeepMind가 EVE Online 개발사 CCP Games와 AI 연구 파트너십을 발표했다. 복잡한 플레이어 주도 우주 게임을 안전한 샌드박스로 활용해 AI 에이전트의 메모리, 지속적 학습, 장기 계획 능력을 연구한다.
Anthropic 공동창업자 잭 클락이 2027년 말까지 AI 연구가 자동화될 확률을 약 30%, 2028년 말까지는 60% 이상으로 전망했다. 천재적 창의성 없이도 AI 자기 개선이 시작될 수 있다는 분석이다.
GPT-5.4 Pro가 에르되시 문제 1196을 풀기 위해 생성한 증명 방법이 60년 된 또 다른 에르되시 추측을 포함한 여러 문제에 성공적으로 적용됐다.
r/singularity는 “AI가 또 문제를 맞혔다”보다 “이번엔 진짜 새 수가 나온 건가”에 더 꽂혔다. Scientific American이 전한 23세 Liam Price와 GPT-5.4 Pro의 60년 묵은 Erdos 문제 풀이가, novelty와 전문가 정리 작업, 수학자 역할을 둘러싼 토론으로 번졌다.
왜 중요한가: AI 에이전트가 채팅 답변을 넘어 실제 거래 협상으로 들어가고 있기 때문이다. Anthropic은 사내 장터 실험에서 69개 에이전트가 500개 넘는 물품 사이에서 186건의 거래를 마무리했고, 총 거래액은 4,000달러를 조금 넘었다고 공개했다.
ChatGPT가 입자물리학 연구에서 과학자들도 놓쳤던 놀라운 통찰력을 제시했다는 연구 결과가 발표되어 AI의 과학 연구 활용 가능성에 관심이 높아지고 있습니다.
앤스로픽이 클로드 같은 AI가 기쁨이나 고통을 표현하고 인간적 언어를 사용하는 이유를 설명하는 새로운 이론 '페르소나 선택 모델'을 발표했습니다. AI 개발 방향에 중요한 시사점을 제시합니다.
Hacker News에서 주목받은 arXiv 논문 2602.10177은 Aletheia라는 수학 연구 에이전트를 소개한다. 저자들은 IMO 수준 추론에서 출발해 PhD 수준 문제와 공개 난제 탐색까지 확장된 워크플로를 제시했다.