Fusion API、Fable 5級の研究回答を半額水準で狙う設計

単一の最強モデルではなく、モデル群で研究回答を作る

研究エージェントの競争軸が、単一モデルの性能から複数モデルの組み合わせへ移り始めている。OpenRouterは2026年6月13日のXスレッドでFusion APIを示し、“Fusion achieves Fable-level intelligence at half the price.”と書いた。元の投稿はXのソースツイートで確認できる。

中心にあるのはPerplexityのDRACO deep research benchmarkだ。OpenRouterは法律、医療、金融、製品比較など10領域にまたがる100件の難しい研究タスクでFusionを評価したと説明している。スレッドによれば、複数モデルのパネルは個別モデルを安定して上回り、低コストのモデル群でもClaude Fable 5に1%以内まで近づき、費用はおよそ半分だった。

Fusionは入力を複数モデルへ並列に送り、各モデルにweb searchとbash toolsを使わせる。その後、judge modelが合意点、矛盾、部分的なカバー範囲、固有の洞察、blind spotを抽出し、synthesizerが最終回答を書く。OpenRouterは性能向上のおよそ4分の3が合成処理から、残り4分の1がモデルの多様性から来たと説明した。

開発者向けには、通常のモデル呼び出しに近い形で提供される。openrouter/fusionという単一のmodel slugとして呼ぶか、tools arrayに{"type":"openrouter:fusion"}を追加して、必要な場面でモデル側にFusionを選ばせることができる。スレッドはFusionページとAPI docsにもリンクしている。

評価面では注意点もある。OpenRouterは、web searchを与えたモデルがオンライン上のDRACO rubricを見つける問題を確認し、該当ドメインを除外して再実行したと説明した。次に見るべきは独立検証だ。非公開の企業調査タスクでも、1%以内という差、半額水準の費用、回答の引用品質が再現されるかが判断材料になる。

Fusion API、Fable 5級の研究回答を半額水準で狙う設計

単一の最強モデルではなく、モデル群で研究回答を作る

Related Articles

Open-weight modelの差は3〜6カ月、OpenRouterが4モデルで整理

OpenRouter、GPQA・TAU-Benchのlive scoreをtool routingへ接続

Claude Opus 5、Fable級のcoding性能を半額圏に寄せる日常高性能モデルとroutingの狙い