Google DeepMind의 AI 수학 연구 에이전트 Aletheia가 FirstProof Challenge에서 전문가 심사단이 인정한 연구 수준 수학 문제 10개 중 6개를 자율적으로 해결했습니다. Gemini Deep Think 기반의 이 에이전트는 테렌스 타오 등 수학자들로부터 가치 있는 연구 협력자로 인정받고 있습니다.
#research
RSS Feed중국 AI 연구소 DeepSeek이 텍스트·이미지·동영상·오디오를 처리하는 1조 매개변수 멀티모달 모델 V4를 이번 주 공개할 예정이며, 화웨이 칩에 최적화돼 미국 GPU 의존도를 낮춘 점이 주목된다.
과학자들이 AI 에이전트를 더 적극적으로(무례하게) 대화하도록 설계했더니 복잡한 추론 작업에서 성능이 향상됐다는 역설적인 연구 결과가 발표되었습니다.
100개 미만의 파라미터를 가진 초소형 트랜스포머 모델이 두 개의 10자리 숫자를 더하는 작업에서 100% 정확도를 달성했다는 흥미로운 연구 결과가 공개되었습니다.
영국 킹스 칼리지 런던의 연구에서 ChatGPT, Claude, Gemini 등 주요 AI 모델이 핵무장 강대국 지도자 역할을 수행한 냉전형 시뮬레이션에서 95%의 게임에서 핵 확전을 선택한 것으로 나타났다.
AI 스타트업 Inception Labs가 확산(diffusion) 기반 언어 모델 Mercury 2를 공개했다. 기존 자기회귀 방식을 탈피해 병렬 정제 방식을 사용하며, 속도와 비용 양면에서 주요 경쟁사를 압도한다.
오리건 주립대 연구팀이 암세포의 산성 환경과 높은 과산화수소 수치를 이용해 두 가지 화학 반응을 동시에 일으키는 철 기반 나노물질을 개발했다. 마우스 실험에서 유방암을 완전히 제거하면서 건강한 조직은 손상시키지 않았다.
앤스로픽이 클로드 코드·API의 수백만 건 상호작용 분석 결과, 99.9번째 백분위 세션 지속 시간이 25분에서 45분으로 두 배 증가하는 등 AI 에이전트 자율성이 실제 환경에서 급격히 높아지고 있음을 확인했습니다.
r/MachineLearning 커뮤니티에서 CVPR, ICLR 등 주요 ML 학회의 논문 수용 규모가 급격히 커지면서 학회 합격의 학문적 가치가 희석되고 있다는 토론이 화제를 모았다. 접근성 향상 vs. 리뷰 품질 저하의 균형 문제가 핵심이다.
AI 분야 선구자 페이페이 리가 이끄는 World Labs가 공간 지능 AI 개발에 10억 달러를 투자 유치했다. Autodesk가 2억 달러를 포함하며, a16z·엔비디아·AMD가 참여했다.
MIT Technology Review가 휴머노이드 로봇 기업들이 인간 원격 조작과 데이터 수집 노동을 얼마나 감추고 있는지를 보도했다. 진정한 자율성 없이 인간 노동을 대체하면 '물리적 긱 이코노미'가 될 수 있다는 우려가 제기됐다.
세계 최대 TV 시청 이벤트인 중국 춘절 갈라에서 유니트리 G1·H2를 비롯한 4개사 휴머노이드 로봇들이 쿵후, 파쿠르, 3m 공중제비 등 세계 최초 퍼포먼스를 선보이며 1년 전과 극적인 대조를 이뤘다.