Meituan LongCat 팀이 음성·이미지·텍스트 기반 아바타 영상 모델 LongCat-Video-Avatar 1.5를 공개했다. Hugging Face 모델 카드는 MIT 라이선스와 Diffusers 사용 예시를 제공한다.
#opensource
RSS Feed일본 ZOZO가 의류·소프트바디 시뮬레이션용 접촉 해석기를 공개했다. 단일 장면에서 1.8억 개가 넘는 접점을 처리하고 Blender 애드온과 Apache 2.0 라이선스를 제공한다.
HY-World 2.0은 text, single-view image, multi-view image, video를 3D Gaussian Splatting scene으로 바꾼다. 더 중요한 신호는 model weights, code, technical details가 공개됐다는 점이다.
Microsoft Research가 긴 agent trajectory에서 첫 critical failure step을 찾는 AgentRx를 공개했다. 115개 failed trajectory benchmark와 nine-category taxonomy도 함께 내놓으며 failure localization과 root-cause attribution 개선 수치를 제시했다.
NVIDIA는 KubeCon Europe에서 GPU Dynamic Resource Allocation driver를 CNCF와 upstream Kubernetes ecosystem으로 넘긴다고 밝혔다. 이번 발표는 confidential containers, KAI Scheduler, Grove API까지 묶어 대규모 AI cluster 운영 표준을 넓히려는 시도로 읽힌다.
OpenCode + OSS LLM 조합을 다룬 r/LocalLLaMA 글은 provider-agnostic 코딩 에이전트, MCP 설정, 오픈 모델의 tool calling 품질 문제를 함께 논의하며 대안적 개발 스택에 대한 수요를 드러냈다.
r/LocalLLaMA에서 1360 points를 얻은 이 글은 HauhauCS 계열의 uncensored 변경과 Jackrong의 reasoning distillation을 결합한 Qwen 3.5 9B GGUF 실험을 소개하며, 소형 로컬 모델 튜닝의 현재 관심사를 보여줬다.
Kitten TTS v0.8의 Show HN 글은 15M~80M ONNX 모델, 25MB급 배포 크기, CPU 중심 설계로 관심을 모았고, 실사용 품질과 데이터 출처에 대한 질문도 함께 끌어냈다.
Dify는 2026년 3월 10일 3천만 달러 규모 Series Pre-A 조달을 발표했다. 회사는 오픈소스 커뮤니티와 엔터프라이즈 확장을 동시에 밀어붙이면서 LLM 크레딧 확대와 workflow·권한 기능 강화를 함께 내놨다.
r/MachineLearning의 프로젝트 공유 글(점수 71, 댓글 12)은 Karpathy의 <code>Microgpt</code>에서 영감을 받은 최소 텍스트 diffusion 구현을 소개했다. 작성자는 143줄 NumPy 버전부터 413줄 PyTorch Transformer 버전까지 같은 diffusion loop를 비교 가능한 형태로 공개했다.
r/LocalLLaMA에서 Heretic 1.2 발표가 주목받았다. 게시글 기준으로 4-bit 로딩으로 VRAM 최대 70% 절감, MPOA 지원, VL 처리 확장, 자동 재개 기능이 핵심 업데이트다.
HashiCorp 공동 창업자 Mitchell Hashimoto가 AI 시대 오픈소스 프로젝트의 기여자 신뢰 관리 문제를 해결하는 새로운 시스템 Vouch를 공개했다. 신뢰받는 기여자가 새로운 기여자를 '보증(vouch)'하는 방식으로 저품질 기여를 필터링한다.