Perplexity、Perplexity ComputerにVoice Modeを追加
Original: Perplexity adds Voice Mode to Perplexity Computer for spoken agent steering View original →
Perplexityが発表したこと
Perplexityは2026年3月4日、Voice ModeをPerplexity Computerに追加すると発表し、話しかけるだけで作業を進められるようになったと説明した。見た目は小さなinterface updateに見えるが、意味はもっと大きい。Perplexity Computerはもともと長いmulti-step taskを処理するagent systemとして設計されており、userが途中修正を再入力しなくても、音声でそのまま介入できるようになるからだ。
changelogが補足した内容
Perplexityの3月6日changelogによれば、Voice ModeはCometで使われているvoice stackをそのまま使い、Computer on webへ直接組み込まれた。会社が示す中心的な使い方はspoken project controlだ。最初にtaskを口頭で説明し、実行中にfeedbackを入れたり、途中で方向を変えたりする操作をkeyboardなしで行える。例としてはlanding pageの作成、financial analysisの実行、進行中のchart修正などが挙げられている。
重要なのは、Perplexity Computerが狭い意味でのvoice assistantではない点だ。Computerはresearch、coding、analysis、deliverable作成を長いsessionでまとめて扱うproductとして売られている。だからVoice Modeは単なるnovelty interfaceではなく、すでにweb toolsや外部service上で動いているagentを調整する追加のcontrol surfaceと見る方が近い。
なぜ重要か
大きな流れとしては、音声interactionが単純なQ&Aからlive workflow managementへ移っていることを示している。実行中のagentを声で方向修正できるなら、planningとexecutionのhandoffはより会話的で中断の少ないものになる。agent productの競争では、基盤modelの能力だけでなく、人間がどれだけ速く介入し、明確化し、反復できるかが同じくらい重要になるはずだ。
Sources: Perplexity X post, Perplexity Changelog
Related Articles
Perplexityは2026年3月31日、leading-edge AI systemのsecurity、trustworthiness、practical defenseを研究するSecure Intelligence Instituteを立ち上げると発表した。Instituteページは、数百万ユーザーと数千enterpriseを支える運用経験を基盤に、PurdueのNinghui Li教授が率い、BrowseSafeやNIST関連のAI agent security論文を初期成果として示している。
GoogleはGemini in ChromeにSkillsを入れ、promptを保存して現在のpageや選択したtabsで再実行できるようにした。Mac、Windows、ChromeOSのEnglish-US desktopユーザーからrolling outされ、calendar追加やemail送信には確認が入る。
重要なのは、GoogleがVertex AIを複数サービスの集合からgoverned agent platformへ移していることだ。Google Cloudの投稿は、Model Garden経由でGemini 3.1 Pro、Lyria 3、Gemma 4、Claude系を含む200+ modelsへアクセスできると説明する。
Comments (0)
No comments yet. Be the first to comment!