기업 RAG의 약점은 답을 모르는 것이 아니라, 필요한 근거가 다른 저장소에 흩어졌을 때 너무 일찍 멈추는 데 있다. Google Research는 충분한 문맥을 검사하고 다시 검색하는 Agentic RAG로 factuality 데이터셋 정확도를 최대 34% 높였다고 밝혔다.
#enterprise-ai
RSS FeedOpenAI frontier models와 Codex가 Amazon Bedrock에서 일반 제공으로 전환됐다. 100만 회 이상 조회된 공식 트윗은 기업 보안·컴플라이언스 흐름 안에서 OpenAI 도구를 쓰는 새 경로를 제시했다.
NVIDIA가 GTC Taipei에서 550B 파라미터 MoE 모델 Nemotron 3 Ultra와 Agent Toolkit을 묶어 기업용 장시간 에이전트 스택을 전면에 세웠다. 공개 모델 대비 최대 5배 빠른 추론과 최대 30% 낮은 비용, 6월 4일 배포 일정이 핵심이다.
Claude Code에 /workflows 기능이 준비 중이라는 관측이 26만 회 이상 조회됐다. 단발성 프롬프트가 아니라 기업 업무 절차를 반복 실행하는 SOP형 에이전트 흐름이 핵심이다.
HashiCorp 창업자 Mitchell Hashimoto가 X에 올린 글이 HN에서 1,650점을 기록하며 화제가 됐다. AI가 버그를 빠르게 고쳐준다는 믿음이 시스템 전체의 취약성을 감추고 있다는 경고다.
OpenAI가 기업의 AI 도입을 가속화하기 위한 전담 자회사 'OpenAI Deployment Company'를 출범했다. 19개 투자사·컨설팅사·시스템통합사로부터 40억 달러를 유치했으며, 스코틀랜드 AI 컨설팅 기업 Tomoro를 인수해 150명의 전문 엔지니어를 확보한다.
Cloudflare가 2026년 Q1 실적에서 3개월간 AI 사용량 600% 증가를 발표하면서 에이전틱 AI 구조조정의 일환으로 직원 1,100명(전체의 20%)을 해고한다고 밝혔다.
메타가 4월 29일 1분기 실적 발표에서 비즈니스 AI 도구가 3월 말 기준 주당 약 1,000만 건의 대화를 처리하고 있다고 공개했다. 연초 100만 건 대비 10배 성장이며, 아직 무료 서비스다.
AI가 비용 항목에서 매출 항목으로 넘어왔다는 점이 핵심이다. Microsoft는 4월 29일 실적 발표에서 AI 사업 연 환산 매출이 370억달러를 넘었고, Azure 및 기타 클라우드 서비스 매출은 40% 늘었으며 상업용 잔존 계약은 6270억달러로 99% 급증했다고 밝혔다.
LocalLLaMA가 Granite 4.1에 반응한 이유는 IBM이 요즘 유행과 반대로 갔기 때문이다. 3B·8B·30B dense 모델을 중심에 두고 instruction following과 tool calling, 운영 비용, 예측 가능한 동작을 전면에 세우자 “실서비스용 모델”로 읽는 반응이 나왔다.
엔터프라이즈 AI의 병목은 모델 품질보다 재시도, 승인, 실행 이력에 더 자주 생긴다. Mistral은 이번 X 글에서 Python으로 짠 흐름을 Le Chat에서 실행하고 Studio에서 추적하는 Workflows를 공개 미리보기로 열었다고 적었다.
Mistral이 커넥터를 glue code가 아니라 플랫폼 기능으로 끌어올렸다. built-in connectors와 custom MCP 서버를 conversations, completions, agents 전반에서 재사용할 수 있고, 4월 15일 릴리스에는 direct tool calling과 requires_confirmation도 함께 들어왔다.