Google DeepMind, Gemini 3.1 Flash-Lite 프리뷰 출시
Original: Gemini 3.1 Flash-Lite has landed. View original →
2026년 3월 3일 Google DeepMind는 X를 통해 Gemini 3.1 Flash-Lite가 preview로 rollout되며 Gemini API와 Google AI Studio에서 사용할 수 있다고 밝혔다. 출시 스레드에서 Google은 Flash-Lite를 Gemini 3 시리즈 중 가장 cost-efficient한 모델로 소개했고, 최고 성능 과시용 flagship tier보다는 intelligence at scale에 맞춘 모델이라고 설명했다.
Google DeepMind는 새 모델을 이전 tier와도 비교했다. 회사 설명에 따르면 Gemini 3.1 Flash-Lite는 Gemini 2.5 Flash보다 더 낮은 가격과 더 빠른 성능으로도 우수한 결과를 낸다. 또한 새로운 thinking levels를 통해 workload별로 reasoning 양을 조절할 수 있어, 개발팀이 production system 안에서 cost, latency, reasoning depth를 더 직접적으로 맞출 수 있다고 했다.
회사 측은 Flash-Lite가 단순한 초저가 model보다 더 복잡한 작업도 처리할 수 있다고 강조했다. 예시로는 UI 생성, dashboard 구축, simulation 생성이 제시됐다. 낮은 가격, 빠른 속도, 조절 가능한 reasoning을 함께 제공한다는 점 때문에, 많은 요청량과 예측 가능한 운영비가 필요한 개발자에게 의미 있는 선택지로 보인다.
Google은 이번 출시를 frontier showcase라기보다 실전 배포용 옵션으로 설명했다. preview access가 이미 Gemini API와 Google AI Studio에서 열려 있는 만큼, Flash-Lite는 Gemini 라인업 안에서 workload를 cost와 reasoning budget 기준으로 더 세밀하게 나누려는 팀에게 새로운 선택지를 제공한다. 주요 원문은 Google DeepMind의 X 스레드다.
Related Articles
Google은 Gemini API 개발자를 위해 Project Spend Caps, 개편된 Usage Tiers, 새 billing dashboard를 AI Studio에 추가했다. Paid usage로 넘어가는 팀이 비용과 확장 조건을 더 예측 가능하게 관리하도록 설계된 업데이트다.
Google AI가 Gemini 3.1 Flash-Lite의 고용량 이미지 분류 및 비즈니스 자동화 활용 사례를 제시했다. 모델은 Gemini API, Google AI Studio, Vertex AI preview 경로로 확장되고 있다.
Google이 4월 21일 Deep Research를 Gemini 3.1 Pro 기반으로 끌어올리고 MCP 연결과 Max 모드를 붙였다. 웹 검색, 업로드 파일, 라이선스 데이터 소스를 한 흐름에서 묶어야 하는 금융·생명과학 팀을 겨냥한 변화다.
Comments (0)
No comments yet. Be the first to comment!