AI 비용은 줄고 매출은 뛰었다. Google은 1분기 Cloud 매출이 63% 늘어 처음 200억달러를 넘겼고, AI Overviews와 AI Mode의 핵심 응답 비용은 Gemini 3 전환 뒤 30% 넘게 낮아졌다고 밝혔다.
#gemini
RSS Feed유럽의 초점은 AI 앱 설치 허용이 아니라 Android 안에서 누가 실제로 행동하느냐다. 유럽연합 집행위원회는 Google이 경쟁 AI 서비스에도 Gemini가 쓰는 수준의 기기 기능 접근을 열어야 한다고 보고 있으며, 의견 수렴 마감은 5월 13일, 최종 판단 목표는 7월 말이다.
HN은 leaderboard 숫자만 보고 움직이지 않았다. Dirac가 더 적은 토큰, hash-anchored edit, AST 기반 문맥 선택으로 coding agent 성능을 끌어올렸다는 주장에 시선이 몰렸다.
4월 24일 Gemini Drop의 핵심은 새 모델 한 개보다 사용 습관이다. 네이티브 Mac 앱, Notebooks 통합, 글로벌 Personal Intelligence, 무료 3분 Lyria 3 Pro, 인터랙티브 시각화가 Gemini를 상시 도우미 쪽으로 밀어 올린다.
중요한 점은 retrieval stack이 text-only search에서 multimodal memory로 이동하고 있다는 데 있다. Google AI Studio는 Gemini Embedding 2가 GA가 됐고 text, image, video, audio, documents 5개 입력을 하나의 model path로 다룬다고 적었다.
중요한 점은 Google이 Vertex AI를 여러 서비스 묶음에서 governed agent platform으로 재배치한다는 데 있다. Google Cloud 글은 Model Garden을 통해 Gemini 3.1 Pro, Lyria 3, Gemma 4, Claude 계열 등 200개+ model 접근을 제공한다고 설명한다.
Google이 4월 21일 Deep Research를 Gemini 3.1 Pro 기반으로 끌어올리고 MCP 연결과 Max 모드를 붙였다. 웹 검색, 업로드 파일, 라이선스 데이터 소스를 한 흐름에서 묶어야 하는 금융·생명과학 팀을 겨냥한 변화다.
Google이 Gemini image generation을 긴 prompt 작성에서 계정 context 활용으로 옮겼다. 미국 Google AI Plus, Pro, Ultra 구독자는 Google Photos와 Nano Banana 2를 연결해 개인 사진과 취향을 반영한 이미지를 만들 수 있다.
HN이 크게 반응한 이유는 실패 패턴이 너무 익숙했기 때문이다. client-side key, 지연되는 cost reporting, hard stop이 아닌 budget alert가 한꺼번에 겹쳤다. Google AI Developers Forum 글은 Firebase AI Logic을 켠 뒤 몇 시간 만에 Gemini API 사용량이 €54,000+까지 갔다고 설명했고, 댓글은 small team에게 cloud billing 안전장치가 충분한지로 번졌다.
Google이 Gemini in Chrome에 Skills를 넣어 반복 prompt를 한 번 저장하고 현재 page나 선택한 tabs에서 다시 실행하게 했다. Mac, Windows, ChromeOS의 English-US desktop 사용자부터 rolling out되며 calendar 추가나 email 발송 같은 작업에는 확인 절차가 붙는다.
HN이 주목한 지점은 새 robotics model 자체보다 “물리 세계에서 reasoning이 얼마나 빨라야 쓸모가 있나”였다. Google DeepMind는 Gemini Robotics-ER 1.6을 spatial reasoning, multi-view understanding, success detection, instrument reading에 맞춘 preview로 내놓았고, 댓글은 gauge-reading demo와 latency, 실제 robot deployment 사이의 간극을 파고들었다.
Google의 새 speech model은 음성 품질보다 더 어려운 문제인 제어성을 전면에 둔다. Gemini 3.1 Flash TTS는 audio tags, 70+ languages, 1,211 Elo, SynthID watermarking을 함께 내세우며 Gemini API, Google AI Studio, Vertex AI, Google Vids로 풀렸다.