이 변화가 큰 이유는 Copilot이 더 이상 가벼운 자동완성 도구 가격표로는 유지되지 않기 때문이다. GitHub는 2026년 6월 1일부터 모든 Copilot 플랜을 AI Credits 기반 토큰 과금으로 바꾸고, 코드 리뷰에는 GitHub Actions minutes까지 붙인다고 적었다.
#developers
RSS FeedCloudflare가 AI Gateway를 agent용 통합 inference layer로 확장해 Workers AI에서 70+ models와 12+ providers를 같은 API로 호출하게 했다. 핵심은 catalog 숫자보다, 한 작업에 inference call이 10번씩 이어지는 agent workflow에서 비용·retry·failover를 한곳에 모으는 데 있다.
OpenAI가 Agents SDK에 model-native harness와 native sandbox execution을 넣어 agent가 파일을 읽고, command를 실행하고, code를 고치는 workflow를 표준화했다. Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel을 지원하며 Python부터 GA로 제공된다.
Amjad Masad는 2026년 4월 10일 X에서 Accenture가 Replit에 투자하고, 내부적으로 도입하며, secure vibecoding을 전 세계 enterprise에 확산하기 위해 함께 일한다고 밝혔다. 공개된 1차 발표는 짧지만 자본 참여, 내부 배치, 70만 명이 넘는 조직의 유통력까지 결합됐다는 점에서 AI 기반 software creation의 enterprise 확산 신호로 읽힌다.
OpenAI는 March 24, 2026 gpt-oss-safeguard와 다른 reasoning model에 바로 쓸 수 있는 prompt 기반 teen-safety policy를 공개했다. 초기 버전은 6개 위험 범주를 다루며, Common Sense Media와 everyone.ai의 의견을 반영했다고 회사는 설명했다.
Google는 Mar 03, 2026, Gemini 3.1 Flash-Lite를 Gemini 3 series 중 가장 빠르고 cost-efficient한 model로 공개했다. preview 단계부터 낮은 token 가격과 높은 throughput을 앞세워 대량 developer workload를 겨냥한다.
Google은 Gemini API 개발자를 위해 Project Spend Caps, 개편된 Usage Tiers, 새 billing dashboard를 AI Studio에 추가했다. Paid usage로 넘어가는 팀이 비용과 확장 조건을 더 예측 가능하게 관리하도록 설계된 업데이트다.
Google은 2026년 2월 4일 Developer Knowledge API와 오픈소스 MCP Server를 소개했다. 이 도구들은 문서, ADR, 코드 스니펫, 공개 URL 같은 팀 지식을 Gemini Code Assist와 AI agent workflow에 연결하는 것을 단순화하는 데 초점을 둔다.
Google DeepMind는 Gemini 3.1 Flash-Lite가 Gemini API와 Google AI Studio를 통해 preview로 제공된다고 밝혔다. 회사는 이를 가장 cost-efficient한 Gemini 3 모델로 소개하며, 더 낮은 가격과 더 빠른 성능, 조절 가능한 thinking levels를 강조했다.
Claude는 Claude Code에 Code Review를 추가하고 PR마다 여러 agent가 병렬로 버그를 찾는 구조를 도입했다고 밝혔다. 기능은 Team과 Enterprise 대상 research preview로 제공된다.