Meta, AWS Graviton 수천만 코어 투입… 에이전트형 AI의 CPU 병목 공략
Original: Meta Partners With AWS on Graviton Chips to Power Agentic AI View original →
이번 계약이 중요한 이유는 AI 인프라 경쟁의 초점이 GPU 밖으로 번졌기 때문이다. Meta는 AWS Graviton 코어 수천만 개를 자사 컴퓨트 포트폴리오에 넣겠다고 밝혔다. Meta 스스로도 자사가 세계 최대급 Graviton 고객이 된다고 설명한다. 여기서 읽히는 메시지는 단순하다. 에이전트형 AI 시대에는 모델 학습용 GPU만으로는 부족하고, 계획 수립·툴 호출·데이터 이동·장시간 실행을 받쳐주는 CPU 계층이 병목이 된다는 점이다.
채팅형 AI는 답을 한 번 내놓고 끝나는 경우가 많지만, 에이전트는 다르다. 여러 단계를 거쳐 추론하고, 외부 시스템을 호출하고, 작업 상태를 유지해야 한다. 이 과정에서 가속기 옆에서 돌아가는 일반 연산 수요가 급격히 커진다. Meta는 AWS Graviton5가 이런 구간에 맞는 선택이라고 본다. 기사에서 강조한 포인트도 같다. 핵심은 모델 한 번 돌리는 속도보다, 에이전트가 실제 서비스 안에서 계속 움직일 때 필요한 데이터 처리량과 대역폭이다. 첫 배치는 수천만 코어 규모로 시작하고, Meta AI와 관련 제품이 커지면 더 늘릴 수 있게 설계했다.
더 흥미로운 대목은 전략이다. Meta는 자체 데이터센터와 자체 하드웨어 투자도 계속하고 있다. 그런데 이번에는 아마존 실리콘을 포트폴리오에 추가했다. 한 가지 칩 아키텍처로 모든 문제를 풀겠다는 접근을 접고, 워크로드별로 맞는 자원을 조합하겠다는 뜻이다. 2026년 AI 시장에서 이 변화는 크다. 이제 기업 경쟁력은 최고급 GPU를 얼마나 확보했는지만으로 설명되지 않는다. 수백만 개 에이전트 작업이 한꺼번에 몰릴 때 응답성을 유지할 수 있는지, 운영비를 낮출 수 있는지, 장애 없이 오래 돌릴 수 있는지가 함께 평가된다.
그래서 이 소식은 흔한 클라우드 제휴 기사로 넘기기 어렵다. Meta가 내놓은 메시지는 분명하다. 다음 인프라 전쟁은 더 똑똑한 모델 하나를 학습시키는 싸움이 아니라, 자율형 제품을 실제 서비스에서 버티게 할 전체 시스템을 갖추는 싸움이다. 숫자로는 Graviton 코어 수천만 개가 눈에 들어오지만, 본질은 따로 있다. AI 경쟁의 중심축이 GPU 수량에서 데이터센터 전체 구성으로 이동하고 있다는 점이다. 원문은 Meta 공지에서 확인할 수 있다.
Related Articles
Meta는 NVIDIA와의 multi-year 계약이 training, inference, 핵심 업무 처리를 위한 AI 최적화 data center 구축을 뒷받침할 것이라고 밝혔다. 이번 발표는 privacy, networking, Vera Rubin cluster 계획까지 하나의 인프라 로드맵으로 묶는다.
Meta는 next-gen AI 확장에 custom silicon이 필수라며 Meta Training and Inference Accelerator(MTIA) 로드맵을 공개했다. 회사는 전통적인 chip cycle과 빠른 model architecture 변화의 간격을 줄이기 위해 2년 만에 4세대를 출시했다고 설명했다.
OpenAI는 2026년 2월 27일 Amazon과의 multi-year strategic partnership을 발표하며 Amazon의 $50B 투자, Amazon Bedrock 기반 agent runtime 공동 추진, 약 2 gigawatts 규모의 Trainium capacity 계획을 공개했다. 이번 계약은 OpenAI의 enterprise agent 전략을 AWS 유통과 인프라에 더 깊게 연결한다.