Perplexity, Perplexity Computer에 Voice Mode 추가
Original: Perplexity adds Voice Mode to Perplexity Computer for spoken agent steering View original →
Perplexity가 발표한 내용
Perplexity는 2026년 3월 4일 Voice Mode를 Perplexity Computer에 넣는다고 발표하며, 이제 말로 지시하고 실제 작업을 진행할 수 있다고 설명했다. 겉으로는 단순한 interface update처럼 보이지만 의미는 더 크다. Perplexity Computer가 원래 긴 multi-step task를 처리하도록 설계된 agent system인 만큼, 사용자가 중간 수정 사항을 다시 타이핑하지 않고 음성으로 바로 개입할 수 있게 되기 때문이다.
changelog가 덧붙인 내용
Perplexity의 3월 6일 changelog는 Voice Mode가 Comet에 쓰이던 동일한 voice stack을 기반으로, web의 Computer 안에 직접 들어왔다고 설명한다. 회사가 제시한 핵심 시나리오는 spoken project control이다. 처음부터 과제를 말로 설명하거나, 실행 도중 피드백을 주거나, 작업 방향을 중간에 바꾸는 일을 keyboard 없이 처리할 수 있다는 것이다. 예시도 실무형이다. landing page를 만들게 하거나, financial analysis를 돌리거나, 이미 진행 중인 chart를 수정하게 하는 식이다.
이 점은 Perplexity Computer가 단순 voice assistant가 아니라는 사실과 연결된다. Computer는 research, coding, analysis, deliverable 생성을 하나의 긴 작업 세션으로 묶는 product로 포지셔닝된다. 그래서 Voice Mode는 novelty interface라기보다, 이미 web tools와 연결 서비스 위에서 움직이고 있는 agent를 조정하는 추가 control surface에 가깝다.
왜 중요한가
더 큰 흐름에서 보면 음성 interaction이 단순 질의응답에서 live workflow management로 이동하고 있다는 뜻이다. 사용자가 실행 중인 agent를 말로 다시 조정할 수 있으면, 계획과 실행 사이의 handoff가 훨씬 덜 끊기고 더 대화형이 된다. 앞으로 agent product 경쟁에서는 underlying model 못지않게, 사람이 얼마나 빨리 개입하고 수정하고 반복할 수 있는지가 usability를 가를 가능성이 크다.
Related Articles
OpenAI는 X에서 Codex Security의 research preview 시작을 알렸다. OpenAI는 이를 복잡한 취약점을 더 적은 noise로 탐지·검증·패치할 수 있는 application security agent로 설명한다.
OpenAI는 3월 9일 X에서 AI security platform Promptfoo를 인수할 계획이라고 밝혔다. Promptfoo는 open source를 유지하며, 이번 거래는 OpenAI Frontier의 agentic testing·evaluation stack을 강화하는 방향이다.
OpenAI가 ChatGPT for Excel 베타를 공개하고 금융 데이터 연동 범위를 확대했다. GPT-5.4 기반 성능 향상과 spreadsheet 내 직접 작업 흐름이 동시에 강조된 발표다.
Comments (0)
No comments yet. Be the first to comment!