IBM·Deepgram, watsonx Orchestrate에 speech-to-text·text-to-speech 통합
Original: Deepgram and IBM Introduce Advanced Voice Capabilities for Enterprise AI View original →
IBM과 Deepgram은 Feb 24, 2026, Deepgram의 speech-to-text와 text-to-speech 기술을 IBM watsonx Orchestrate에 통합하는 협력을 발표했다. 이번 통합은 voice interface, transcription, real-time captioning을 이미 사용 중인 digital agent와 workflow automation 환경 안에서 함께 운영하려는 enterprise AI 팀을 겨냥한다.
IBM은 enterprise-grade transcription과 real-time captioning을 지원하기 위해 watsonx Orchestrate 안에 Deepgram capability를 embed하겠다고 밝혔다. 이번 구조에서 Deepgram은 IBM의 첫 voice partner가 된다. 이는 IBM이 watsonx를 확장하는 방식을 보여주는 신호이기도 하다. 모든 modality를 직접 만들기보다, speech quality와 latency, reliability가 특히 중요한 영역에서는 전문 provider를 orchestration layer 위에 결합하겠다는 접근이다.
이번 발표는 enterprise AI 수요가 어디로 움직이는지도 보여준다. 두 회사 모두 voice를 단순한 편의 기능이 아니라 실제 시스템의 기본 interface로 보고 있다. spoken instruction을 받는 digital agent, 대화를 요약하거나 전달하는 internal assistant, 낮은 latency와 자연스러운 audio output이 필요한 customer-facing workflow가 대표적이다. IBM은 watsonx Orchestrate를 이런 흐름을 관리하는 계층으로 두고, Deepgram은 그 아래 speech stack을 제공하는 구조를 만들고 있다.
Deepgram CEO는 enterprise deployment에는 정확하고 low latency이며 대규모에서도 안정적으로 동작하는 real-time platform이 필요하다고 말했다. IBM 측도 이번 통합을 open ecosystem 안에서 customer choice를 유지하면서 운영 현대화를 돕는 방법으로 설명했다. 이런 표현은 이번 협력이 단순한 chatbot demo가 아니라 대형 조직용 production infrastructure를 겨냥한다는 점을 분명히 한다.
실무적으로 보면 voice AI는 이제 enterprise software의 주변 기능이 아니라 중심 workflow로 들어가고 있다. speech recognition과 text-to-speech를 별도 add-on처럼 다루는 대신, model과 agent, business process가 이미 관리되는 orchestration platform 안으로 흡수하는 방향이다. IBM이 이를 잘 실행하면 Deepgram 협력은 voice를 특수 프로젝트가 아닌 enterprise agent deployment의 기본 기능으로 바꿔놓을 수 있다.
Related Articles
IBM은 2026 X-Force Threat Index에서 public-facing applications 악용으로 시작한 공격이 전년 대비 44% 증가했다고 밝혔다. 보고서는 2025년 관측 incident의 40%가 vulnerability exploitation에서 시작했고, infostealer로 노출된 ChatGPT credential이 300,000개를 넘었다고도 설명한다.
Anthropic는 powerful AI가 사회에 던질 과제를 다루는 공익 조직 The Anthropic Institute를 출범시켰다. 회사는 이 조직이 technical·economic·social science 관점을 결합해 public conversation을 넓히는 역할을 맡는다고 밝혔다.
Google AI는 2026년 3월 6일 X를 통해 Nano Banana 2가 Google AI Studio와 Vertex AI의 Gemini API에서 바로 사용 가능하다고 밝혔다. 연결된 Google 글은 Nano Banana 2, 즉 Gemini 3.1 Flash Image를 실제 애플리케이션용 고품질·고속 image model로 소개한다.
Comments (0)
No comments yet. Be the first to comment!