Google, Gemini API에 context circulation·tool combos·Maps grounding 추가
Original: Gemini API tooling updates: context circulation, tool combos and Maps grounding for Gemini 3 View original →
Google는 Mar 17, 2026 Gemini 3 기반 agent workflow를 더 쉽게 만들기 위한 Gemini API 업데이트를 발표했다. 이번 변경은 model이 built-in tool과 서비스별 custom function을 오가며 작업할 때 필요한 orchestration 부담을 줄이는 데 초점이 있다.
가장 큰 변화는 Google Search나 Google Maps 같은 built-in tool과 개발자가 정의한 function declaration을 하나의 request 안에서 함께 넘길 수 있게 된 점이다. 이전에는 public data retrieval과 internal action을 여러 단계로 나눠 조정해야 하는 경우가 많았지만, 이제는 model이 한 interaction 안에서 외부 정보 조회와 backend action 사이를 자연스럽게 전환할 수 있다.
핵심 업데이트
- built-in tool과 custom function을 같은 interaction에서 함께 사용할 수 있다.
- context circulation이 tool output을 이후 추론 단계의 context에 유지한다.
- 각 tool call에 unique id가 부여돼 asynchronous execution과 debugging이 쉬워진다.
- Grounding with Google Maps가 Gemini 3 family로 확대돼 location-aware response를 지원한다.
Google는 built-in tool용 context circulation도 도입했다. 이 기능은 앞선 tool call과 그 응답을 이후 단계의 model context에 남겨 두기 때문에, 클라이언트가 중간 결과를 매번 다시 써 넣지 않아도 model이 다음 추론 단계에서 이를 활용할 수 있다. 동시에 각 tool call에 unique id를 붙여 asynchronous execution이나 parallel tool flow에서 어떤 요청과 응답이 연결되는지 더 분명하게 추적할 수 있게 했다.
또 다른 핵심은 Grounding with Google Maps가 Gemini 3 family로 확대됐다는 점이다. Google는 이를 통해 place detail, commute time, local business information 같은 최신 spatial context를 model이 사용할 수 있다고 설명했다. travel, commerce, logistics, field service, local discovery 같은 서비스에서는 location-aware response의 품질과 구현 속도 모두에 영향을 줄 수 있는 변화다.
Google는 같은 기능이 generateContent API에서도 동작하지만, server-side state management와 unified reasoning trace를 위해서는 Interactions API 사용을 권장했다. 이번 발표는 새 model 자체보다도 multi-tool agent를 production으로 옮길 때 필요한 실행 계층을 다듬는 업데이트에 가깝다.
출처: Google
Related Articles
Google은 Gemini API 개발자를 위해 Project Spend Caps, 개편된 Usage Tiers, 새 billing dashboard를 AI Studio에 추가했다. Paid usage로 넘어가는 팀이 비용과 확장 조건을 더 예측 가능하게 관리하도록 설계된 업데이트다.
Perplexity는 2026년 3월 11일 Agent API를 공개하며 search, tool execution, multi-model orchestration을 하나의 managed runtime으로 묶겠다고 밝혔다. 이번 출시는 Perplexity를 단순 답변 인터페이스보다 production agent workflow용 인프라에 더 가깝게 위치시킨다.
Google DeepMind는 2026년 3월 3일 Gemini 3.1 Flash-Lite를 업데이트하며 대량·저지연 워크로드용 모델로 제시했다. 회사는 128k input, 8k output, multimodal 입력, native audio generation, 그리고 $0.10/$0.40 수준의 저가 token pricing을 강조했다.
Comments (0)
No comments yet. Be the first to comment!