Cohere, open 2B ASR model Transcribe와 WebGPU 브라우저 demo 전면 배치

Original: Cohere Transcribe is setting a new standard for automatic speech recognition model accuracy in real world conditions – even with a noisy blender running. Try it out for yourself 👇 View original →

Read in other languages: English日本語
AI Mar 28, 2026 By Insights AI (Twitter) 1 min read Source
Cohere, open 2B ASR model Transcribe와 WebGPU 브라우저 demo 전면 배치

2026년 3월 28일 Cohere는 X에서 Cohere Transcribe가 noisy blender 환경까지 포함한 real-world conditions에서 automatic speech recognition의 새로운 기준을 세우고 있다고 주장하며 직접 체험 링크를 공유했다. 짧은 post이지만, 바로 앞선 며칠 동안 Hugging Face를 통해 모델과 demo가 공개된 흐름 위에 올라온 발표라는 점에서 단순한 teaser 이상이다. Cohere가 Transcribe를 연구 성능과 개발자 배포 가능성을 동시에 갖춘 ASR asset으로 포지셔닝하고 있다는 신호로 읽힌다.

기술적인 실체는 Hugging Face model page에서 더 분명해진다. Cohere Transcribe는 dedicated 2B-parameter audio-in, text-out ASR model로 소개되며, scratch부터 학습됐고 Apache 2.0 라이선스로 공개됐다. 지원 언어는 유럽계 언어, East Asian 언어, Arabic을 포함한 14개다. 또한 model card는 transformers native support와 vLLM integration 경로를 언급하고 있어, 이 모델이 단순 benchmark artifact가 아니라 offline inference와 server-side deployment 양쪽을 겨냥한 release임을 보여 준다.

별도의 Hugging Face Space인 Cohere Transcribe WebGPU는 이 이야기의 무게를 더한다. 해당 Space는 Transcribe를 WebGPU로 브라우저 로컬에서 실행할 수 있다고 설명하며, 원본 model과 ONNX conversion을 함께 연결한다. 이는 Cohere가 accuracy만이 아니라 deployability도 함께 밀고 있음을 뜻한다. hosted API에만 머무르지 않고, browser-side inference와 local execution, open-weight workflow를 함께 보여 주고 있기 때문이다.

개발자 관점에서 중요한 것은 바로 이 조합이다. speech recognition은 흔히 benchmark table로 비교되지만, 실제 adoption은 license, language coverage, framework support, embedding 난이도 같은 요소에 달려 있다. X post 자체만으로는 full methodology나 detailed benchmark sheet가 공개되지는 않으므로, 팀들은 여전히 자신의 audio domain에 맞는 검증이 필요하다. 그럼에도 3월 28일 post는 Cohere가 text 중심 model launch를 넘어, open distribution과 browser-native experimentation을 동반한 실용적 speech infrastructure로 확장하고 있음을 분명히 보여 준다.

출처: Cohere X 게시물 · Cohere 브라우저 demo X 게시물 · Hugging Face model page · WebGPU demo Space

Share: Long

Related Articles

AI sources.twitter 1d ago 1 min read

Cohere는 2026년 3월 26일 Transcribe를 open-source speech recognition model로 발표했다. Cohere에 따르면 이 2B Conformer 기반 시스템은 14개 언어를 지원하고, Hugging Face Open ASR Leaderboard에서 평균 WER 5.42로 1위를 기록했으며, Apache 2.0 license로 배포되고, download·API·Model Vault 경로를 모두 제공한다.

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.