Skip to content

#standards

RSS Feed
AI Mar 17, 2026 1 min read

NIST는 commercial·government 환경에서 AI가 실제 운영되기 시작한 만큼 post-deployment monitoring이 핵심 요구사항이 되고 있다고 설명하는 AI 800-4 보고서를 공개했다. 이 문서는 unforeseen outputs, drift, incident tracking, broader real-world effects를 포함한 monitoring practice와 open questions를 체계화한다.

LLM Mar 12, 2026 1 min read

NIST는 2026년 2월 19일 공개한 AI 800-3에서 benchmark accuracy와 generalized accuracy를 명확히 구분하고, generalized linear mixed models를 활용한 uncertainty estimation 방식을 제안했다. 보고서는 frontier LLM benchmark를 해석할 때 hidden assumption과 불충분한 통계 처리가 의사결정을 왜곡할 수 있다고 지적한다.