Google, 머신러닝 투자 절반 이상을 클라우드로… Gemini 운영 단계 진입

Google이 Cloud Next 2026에서 던진 메시지는 단순한 제품 소개보다 더 크다. 기업용 AI가 실험 단계에서 운영 단계로 이동하고 있다는 선언에 가깝다. Sundar Pichai의 4월 22일 글에 따르면 Google의 자사 모델은 고객 직접 API 사용 기준으로 분당 160억 토큰 이상을 처리하고 있다. 지난 분기 100억 토큰에서 한 번 더 뛰었다. Google은 2026년 전체 머신러닝 연산 투자 가운데 절반 이상이 클라우드 사업으로 갈 예정이라고도 적었다.

수요 지표도 같이 나왔다. Google은 1분기 Gemini Enterprise 유료 월간 활성 사용자가 전 분기 대비 40% 늘었다고 밝혔다. 여기서 Google이 짚은 다음 과제는 접근권이 아니라 운영이다. 이제 질문은 에이전트를 하나 만들 수 있느냐가 아니다. 수천 개를 어떻게 통제하고 관리하느냐다. 그래서 새 Gemini Enterprise Agent Platform을 내세웠다. Google은 이를 에이전트를 만들고, 거버넌스를 걸고, 확장하고, 최적화하는 보안형 전층 플랫폼으로 설명한다.

인프라도 공격적으로 밀고 있다. Google은 8세대 TPU 두 계열을 공개했다. 학습용 TPU 8t는 단일 슈퍼팟에서 TPU 9,600개와 2페타바이트 규모의 고대역폭 공유 메모리까지 확장할 수 있다고 한다. 추론용 TPU 8i는 단일 팟에서 TPU 1,152개를 연결하고, 온칩 SRAM을 3배로 늘려 대규모 에이전트 추론에 필요한 지연시간과 처리량을 맞춘다는 설명이다. Google은 TPU 8t가 Ironwood 대비 3배 처리 성능과 최대 2배 전력 효율을 낸다고 주장했다.

보안 수치도 함께 꺼냈다. Google은 자사 보안 운영 센터 에이전트가 매달 수만 건의 비정형 위협 보고서를 분류하고, 위협 대응 시간을 90% 이상 줄이고 있다고 적었다. 내부 개발에서는 새 코드의 75%가 AI가 생성하고 엔지니어가 승인하는 방식으로 작성된다고 밝혔다. 지난해 가을의 50%에서 더 올라간 수치다. Google은 고객에게 팔려는 에이전트 운영 방식을 이미 내부에서 쓰고 있다는 점을 강조하고 있다.

경쟁 구도도 분명해졌다. Google이 팔고 싶은 것은 모델 하나가 아니다. 에이전트를 실제 시스템에 붙여 돌릴 기업을 위한 제어면, 보안 스택, 연산 인프라 전체다. Cloud Next에서 나온 숫자는 시장의 관심이 데모를 잘하는 회사보다 운영 규모를 감당하는 회사로 옮겨가고 있음을 보여준다.

Google, 머신러닝 투자 절반 이상을 클라우드로… Gemini 운영 단계 진입

Related Articles

Microsoft, 태국에 US$1 billion 이상 투자… cloud·AI 인프라와 디지털 인재 육성 확대

Google 비디오 모델 'Omni' 유출 — 텍스트 일관성에 주목

앤트로픽, 구글 클라우드에 5년간 2,000억 달러 투자 계약 — 구글 백로그의 40% 육박

Related Articles

Microsoft, 태국에 US$1 billion 이상 투자… cloud·AI 인프라와 디지털 인재 육성 확대
AI Apr 11, 2026 1 min read

Google 비디오 모델 'Omni' 유출 — 텍스트 일관성에 주목
AI Reddit May 12, 2026 1 min read

앤트로픽, 구글 클라우드에 5년간 2,000억 달러 투자 계약 — 구글 백로그의 40% 육박
AI May 11, 2026 1 min read