2026년 3월 r/LocalLLaMA에서 123 points와 25 comments를 얻은 `voxtral-voice-clone` 프로젝트는 Mistral의 Voxtral-4B-TTS-2603에 빠져 있던 codec encoder를 직접 학습해 `ref_audio` 기반 zero-shot voice cloning을 복구하려는 시도다.
#mistral
RSS FeedLocalLLaMA의 높은 반응은 분명했다. Mistral이 낮은 latency, multilingual 지원, open weights를 함께 내놓으며 여전히 닫혀 있던 speech layer에 실전형 선택지를 제시했기 때문이다.
r/LocalLLaMA에서 확산된 Hugging Face Transformers PR #44760은 Mistral 4를 128 experts, 4 active experts, 6.5B activated parameters per token, 256k context를 갖춘 hybrid instruct/reasoning model로 드러낸다.
2026년 3월 16일 r/LocalLLaMA의 Mistral Small 4 글은 최신 사용 가능 크롤 기준 606 points와 232 comments를 기록했다. Mistral 모델 카드는 4 active expert, 256k context, 멀티모달 입력, 요청별 reasoning 전환을 갖춘 119B급 MoE를 설명한다.
MistralAI는 2026년 3월 17일 Forge를 통해 기업이 proprietary knowledge 위에 frontier-grade AI 모델을 구축할 수 있다고 밝혔다. 공식 글은 이를 pre-training, post-training, reinforcement learning, agent-first workflow, 다양한 아키텍처 지원, 규제 환경용 governance 제어까지 포함하는 플랫폼으로 설명한다.
Mistral AI는 2026년 3월 16일 NVIDIA와 frontier open-source AI models를 공동 개발하는 전략적 파트너십에 들어간다고 밝혔다. 이어진 Mistral 공식 글은 Mistral이 NVIDIA Nemotron Coalition의 founding member로 참여하며 large-scale model development와 multimodal capabilities를 제공한다고 설명한다.
Mistral은 Voxtral Realtime와 Voxtral Mini Transcribe V2를 공개하며 sub-200ms streaming transcription, 13개 언어 지원, realtime model의 open weights를 내놓았다. 동시에 Mistral Studio의 audio playground와 $0.003/min·$0.006/min pricing도 함께 제시했다.
Mistral이 Apache 2.0 기반의 멀티모달 오픈 모델군 Mistral 3를 발표했다. 14B, 8B, 3B dense 모델과 41B active, 675B total 규모의 Mistral Large 3를 함께 제시했다.
Mistral AI의 Voxtral Realtime 4B 음성인식 모델을 순수 C 언어로 구현한 voxtral.c가 공개되었습니다. Python이나 CUDA 없이 C 표준 라이브러리만으로 실행되며, Apple Silicon에서는 실시간보다 2.5배 빠른 속도로 음성을 텍스트로 변환할 수 있습니다. 메모리 맵핑 방식으로 '거의 즉시' 로딩되며, 무제한 길이의 오디오를 1.8GB 메모리로 처리할 수 있습니다.