#agents

AI Apr 25, 2026 1 min read

Meta, AWS Graviton 수천만 코어 투입… 에이전트형 AI의 CPU 병목 공략

Meta가 AWS Graviton 코어 수천만 개를 들여오며 AI 인프라 전쟁의 축을 GPU 밖으로 넓혔다. 회사는 에이전트형 AI가 계획 수립, 툴 호출, 데이터 이동 같은 CPU 집약 구간을 키우고 있다며 Graviton5를 핵심 조합으로 제시했다.

#meta #aws #graviton

LLM Reddit Apr 25, 2026 1 min read

27B가 여기까지 왔나, LocalLLaMA가 Qwen3.6에 술렁인 이유

LocalLLaMA가 이 글을 밀어 올린 이유는 모두가 벤치마크를 믿어서가 아니다. 27B 오픈 모델이 에이전트형 작업에서 갑자기 경쟁권으로 들어온 듯 보였고, 그래서 더 중요해 보이면서도 동시에 더 수상해 보이는 결과가 토론을 키웠다.

#qwen #open-weights #benchmarks

AI X/Twitter Apr 23, 2026 1 min read

ParseBench, Kaggle에 2,000개 기업 문서·16.7만 OCR 규칙 공개…에이전트용 검증판

중요한 점은 enterprise OCR failure가 academic PDF benchmark보다 훨씬 먼저 agent를 망가뜨린다는 데 있다. LlamaIndex는 ParseBench가 사람 검증을 거친 약 2,000개 페이지와 16만7천 개가 넘는 규칙으로 14개 방법을 Kaggle에서 비교한다고 적었다.

#llamaindex #parsebench #ocr

LLM Apr 23, 2026 1 min read

Codex 주간 사용자 400만 돌파… OpenAI, Codex Labs와 7개 GSI 배포망

이건 단순한 이용자 숫자 기사가 아니라 유통 전략 기사에 가깝다. OpenAI는 4월 초 주간 개발자 300만명 이상이던 Codex가 2주 만에 400만명을 넘겼고, 이 수요를 Codex Labs와 7개 GSI 파트너 체제로 받아내겠다고 했다.

#openai #codex #enterprise

LLM Apr 23, 2026 1 min read

Responses API에 WebSocket… OpenAI agent loop 최대 40% 단축

병목이 GPU에서 API 계층으로 옮겨가자 OpenAI는 전송 방식을 손봤다. Responses API에 WebSocket 모드와 연결 범위 캐시를 넣으면서 agent workflow가 end-to-end 기준 최대 40% 빨라졌고, GPT-5.3-Codex-Spark는 1,000 TPS와 최대 4,000 TPS burst에 도달했다고 한다.

#openai #responses-api #websockets

AI Apr 22, 2026 1 min read

NVIDIA Nemotron-Personas-Korea, 7M 합성 사용자로 agent 현지화

NVIDIA가 Hugging Face에 Nemotron-Personas-Korea를 공개했다. 한국 공공통계에 기반한 7 million synthetic personas는 agent localization이 번역뿐 아니라 지역, 존댓말, 직업, 공공 서비스 맥락까지 다뤄야 한다는 점을 보여준다.

#nvidia #nemotron #synthetic-data

AI X/Twitter Apr 22, 2026 1 min read

Gemini Enterprise Agent Platform, Vertex AI를 200+ model agent 기반으로 통합

중요한 점은 Google이 Vertex AI를 여러 서비스 묶음에서 governed agent platform으로 재배치한다는 데 있다. Google Cloud 글은 Model Garden을 통해 Gemini 3.1 Pro, Lyria 3, Gemma 4, Claude 계열 등 200개+ model 접근을 제공한다고 설명한다.

#google-cloud #gemini #vertex-ai

AI X/Twitter Apr 22, 2026 1 min read

OpenAI Workspace agents, Business·Edu plan에서 업무 대행 research preview

중요한 점은 ChatGPT가 답변 도구에서 회사 workflow를 실제로 굴리는 공유 agent로 이동한다는 데 있다. research preview 대상은 Business, Enterprise, Edu, Teachers까지 4개 plan군이다.

#openai #workspace-agents #chatgpt-business

LLM Apr 21, 2026 1 min read

Google Deep Research, Gemini 3.1 Pro·MCP 연결로 기업 조사 에이전트화

Google이 4월 21일 Deep Research를 Gemini 3.1 Pro 기반으로 끌어올리고 MCP 연결과 Max 모드를 붙였다. 웹 검색, 업로드 파일, 라이선스 데이터 소스를 한 흐름에서 묶어야 하는 금융·생명과학 팀을 겨냥한 변화다.

#google #gemini #mcp

LLM Reddit Apr 20, 2026 1 min read

Qwen3.6에 LocalLLaMA가 들뜬 이유: benchmark보다 agent가 고치는 모습이었다

r/LocalLLaMA가 900점 넘게 반응한 이유는 Qwen3.6 score표가 아니라, local coding agent가 canvas bug와 wave completion issue를 스스로 찾아 고쳤다는 사용기였다.

#qwen #local-llm #agents

AI Apr 19, 2026 1 min read

Cloudflare 조사, 주요 사이트의 agent-ready 표준은 거의 비어 있다

Cloudflare는 traffic 상위 200,000개 domain을 scan해 AI usage preference 선언은 4%, Markdown content negotiation은 3.9%, MCP Server Card와 API Catalog 노출은 15개 미만이라는 결과를 냈다. Agent Readiness score는 agent web을 감사 가능한 checklist로 바꾼다.

#agents #cloudflare #web-standards

AI X/Twitter Apr 19, 2026 1 min read

Hugging Face, 100만 Spaces를 AI agent 호출 도구 목록으로 넓혔다

중요한 점은 agent 경쟁이 더 큰 model만이 아니라 안정적으로 호출할 수 있는 tool catalog로 이동한다는 데 있다. Clement Delangue는 agent가 100만개 Hugging Face Spaces를 호출할 수 있다고 구체적인 숫자를 제시했다.

#huggingface #agents #spaces