Cohere, 2B·Apache 2.0 기반 speech recognition 모델 Transcribe 공개
Original: Introducing: Cohere Transcribe – a new state-of-the-art in open source speech recognition. View original →
Cohere가 발표한 내용
2026년 3월 26일 Cohere는 X에서 Transcribe를 새로운 state-of-the-art open-source speech recognition model로 소개했다. 공식 release page는 이 주장을 더 구체화한다. Cohere에 따르면 Transcribe는 2B parameter 규모의 Conformer 기반 encoder-decoder model이며, 연구 데모가 아니라 production-grade automatic speech recognition을 목표로 처음부터 훈련되었다.
release page가 말하는 핵심
Cohere는 Transcribe가 14개 언어를 지원하고 Apache 2.0 license로 배포된다고 설명한다. 또한 이 모델이 현재 Hugging Face Open ASR Leaderboard에서 평균 word error rate 5.42로 1위를 기록하고 있으며, 공개된 다른 open·closed speech system보다 앞선다고 주장한다. Cohere는 단순한 benchmark 성적보다 실제 배포에서 중요한 low word error rate와 high throughput의 균형도 강조한다.
release page는 Transcribe를 meeting transcription, speech analytics, audio search, real-time customer support agent를 위한 실용적 building block으로 위치시킨다. Cohere는 이 모델을 Hugging Face의 open weights, 실험용 API, 그리고 managed private deployment를 위한 Model Vault라는 세 경로로 제공한다. 이는 로컬 infrastructure control을 원하는 개발자와 self-managing 없이 운영하고 싶은 enterprise를 동시에 겨냥한 배치다.
왜 중요한가
speech는 AI stack 안에서도 여전히 파편화된 영역이었고, 강력한 모델일수록 상용 API나 더 좁은 license에 묶이는 경우가 많았다. Cohere는 Apache license, leaderboard 선두 성능, 비교적 관리 가능한 serving footprint를 결합해 speech recognition을 mainstream enterprise toolchain 쪽으로 끌어오려 한다. launch benchmark 밖에서도 latency와 accuracy 주장이 유지된다면, Transcribe는 품질을 포기하지 않으면서 open speech infrastructure를 원하는 조직의 유력한 기본 선택지가 될 수 있다.
Related Articles
Show HN를 통해 Moonshine Voice가 빠르게 확산됐다. 프로젝트는 실시간 음성 제품을 겨냥해 정확도와 지연시간을 함께 개선했다고 주장한다.
Anthropic가 2026년 2월 12일 Series G로 300억 달러를 조달하고 post-money valuation 3,800억 달러를 기록했다고 밝혔다. 회사는 이 자금을 frontier research, product development, infrastructure expansion에 투입하겠다고 설명했다.
Microsoft는 2026년 3월 9일 Copilot Wave 3, Agent 365, Claude와 차세대 OpenAI 모델 지원을 묶은 Frontier Suite를 발표했다. Agent 365는 5월 1일 사용자당 15달러, Microsoft 365 E7은 5월 1일 사용자당 99달러로 일반 공개된다.
Comments (0)
No comments yet. Be the first to comment!