중요한 점은 agent 경쟁이 더 큰 model만이 아니라 안정적으로 호출할 수 있는 tool catalog로 이동한다는 데 있다. Clement Delangue는 agent가 100만개 Hugging Face Spaces를 호출할 수 있다고 구체적인 숫자를 제시했다.
#huggingface
RSS FeedPrismML은 작은 open model이 architecture만이 아니라 weight format 변화로도 쓸 만해질 수 있는지 시험한다. Ternary Bonsai는 1.58 bits에서 8B, 4B, 1.7B 모델을 내고 8B variant는 1.75GB로 제시됐다.
Vulmon의 2026년 4월 7일 X post는 Hugging Face Transformers Trainer checkpoint loading 과정의 arbitrary code execution 이슈인 CVE-2026-1839를 짚었다. CVE.org에 따르면 v5.0.0rc3 이전 버전은 PyTorch 2.6 미만 환경에서 조작된 rng_state.pth 파일로 code execution이 가능하며, fix는 weights_only=True를 추가한다.
r/LocalLLaMA에서 확산된 Hugging Face Transformers PR #44760은 Mistral 4를 128 experts, 4 active experts, 6.5B activated parameters per token, 256k context를 갖춘 hybrid instruct/reasoning model로 드러낸다.
Hugging Face는 Spring 2026 보고서에서 13 million users, more than 2 million public models, over 500,000 public datasets를 제시했다. 오픈소스 AI가 빠르게 커지고 있지만 사용은 소수의 핵심 artifact에 집중되고, 중국과 독립 개발자의 영향력은 더 커지고 있다는 분석이다.
2026년 3월 4일 LocalLLaMA 고득점 글에서 Microsoft의 open-weight multimodal 모델 Phi-4-Reasoning-Vision-15B가 공유됐고, 로컬 배포 관점의 토론이 이어졌다.
r/LocalLLaMA에서 Qwen3.5-122B-A10B 공개 링크가 빠르게 확산되며, GGUF 배포 시점과 양자화 효율, 실사용 처리량이 주요 화두가 됐다. 모델 카드 기준으로는 122B total / 10B activated MoE 구조, Apache-2.0 라이선스, 262,144 토큰 기본 컨텍스트가 제시됐다.
r/LocalLLaMA의 고득점 스레드는 Hugging Face에 공개된 Qwen3.5-397B-A17B를 빠르게 확산시켰고, 모델 카드의 397B/17B 구조와 최대 약 1M 토큰 확장 컨텍스트가 핵심 논점으로 부상했다.