LLM Hacker News May 20, 2026 1 min read
ACM CAIS '26에 발표된 오픈소스 Python 프레임워크 Forge가 Ministral-3 8B 모델에 가드레일을 적용해 에이전트 작업 정확도를 53%에서 99%로 향상시켰다.
ACM CAIS '26에 발표된 오픈소스 Python 프레임워크 Forge가 Ministral-3 8B 모델에 가드레일을 적용해 에이전트 작업 정확도를 53%에서 99%로 향상시켰다.
이번 이슈는 단순 장애 공지가 아니다. GitHub는 2025년 10월 시작한 10배 증설 계획을 2026년 2월 30배 규모로 다시 잡았고, 4월 23일 사고에서는 230개 저장소와 2,092개 PR이 영향권에 들어갔다.
Google은 Gemini API에 Flex와 Priority service tiers를 추가해 background 작업에는 저비용 synchronous inference를, critical traffic에는 더 높은 assurance를 선택할 수 있게 했다. 이 변화는 agent 개발자가 여러 API로 아키텍처를 쪼개지 않고도 비용과 신뢰도를 분리 설계할 수 있게 해준다.