Perplexity、searchとtool executionを束ねるAgent APIを公開

Original: Agent API: A Managed Runtime for Agentic Workflows View original →

Read in other languages: 한국어English
LLM Mar 16, 2026 By Insights AI 1 min read Source

Perplexityが公開したもの

Perplexityは2026年3月11日Agent APIを発表し、integrated search、tool execution、multi-model orchestrationを備えたmanaged runtimeだと説明した。重要なのは、開発者がmodel router、search layer、embeddings provider、sandbox service、monitoring stackを個別に組み合わせなくてもよいという点だ。Perplexityはこれらを単一のintegration pointとして提供しようとしている。

この製品は単発のmodel callではなく、agent loopを前提に設計されている。Perplexityによれば、runtimeはobjectiveを受け取ると、それを段階的なplanに分解し、適切なtoolを選び、実行し、結果を観察し、目標が満たされたかを評価しながら反復する。説明例では、営業前の事前準備として、agentが社内CRMを確認し、web_searchを実行し、必要なページをfetch_urlで読み込み、内部履歴と外部情報をまとめて1つのresponseにする。

初期版で利用できる機能

最初のリリースには、built-in toolとして web_searchfetch_url が含まれる。Perplexityは web_search について、domain allowlist・denylist、recencyとdate range、language filter、ページごとのcontent budget設定をサポートするとしている。fetch_url は特定URLの全文を取得・抽出する。さらにcustom functionsも使えるため、built-in search stackを社内database、CRM、private APIとつなぐ構成も可能になる。

もう1つの重要な軸はmodel-agnostic戦略だ。PerplexityはAgent APIが複数のfrontier model providerをまたいで動作し、優先モデルが使えない場合は自動的に次のモデルへ切り替えるfallback chainをサポートすると説明している。公式docsは、third-party frontier modelへのアクセスをdirect provider ratesで、no markupで提供すると案内している。production agentを構築するチームにとって、tool use、provider abstraction、high-availability routingが1つの製品にまとまったことが最大の技術的シグナルだ。

なぜ重要か

現在のagent製品の多くは、chat surfaceか、薄いinference routerにとどまっている。Perplexityは今回、execution layerそのものを販売しようとしている。これは、実運用のagent systemが失敗しやすい場所がraw generationよりもorchestrationだからだ。planning、retrieval、tool invocation、fallback処理、追加stepの判断が、現場の難しさを決める。

Perplexityはpresetという形で自社の調整ノウハウも商品化している。会社によれば、presetはsystem prompt、tool set、cost profileをあらかじめ組み合わせ、quick lookup、balanced research、deeper multi-source analysisのような用途向けに最適化されている。もしこれが実務で機能するなら、小規模チームはagent stack全体を自作する代わりに、動くruntimeをそのまま採用できる。大きく見ると、Perplexityはconsumer answer productから、search-heavy agent workflowのinfrastructure layerへと重心を移している。

出典: Perplexity blog · Perplexity docs

Share: Long

Related Articles

LLM sources.twitter 4d ago 1 min read

OpenAI Developersは2026年3月11日、Responses APIが長時間のagent workflowを処理するために使うhosted computer environmentの設計を説明した。中心となる要素はshell execution、hosted container、制御されたnetwork access、reusable skills、native compactionだ。

LLM sources.twitter 22h ago 1 min read

PerplexityはMarch 13, 2026のX postで、Perplexity ComputerがPerplexity app内のiOSで利用可能になったと発表した。前日のPro subscribers向け提供開始に続き、mobile control surfaceまで追加されたことで、Computerを長時間動くagent workflowとして押し出す流れがより明確になった。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.