Fusion API、Fable 5級の研究回答を半額水準で狙う設計
Original: OpenRouter Fusion API claims Fable-level research at half price View original →
単一の最強モデルではなく、モデル群で研究回答を作る
研究エージェントの競争軸が、単一モデルの性能から複数モデルの組み合わせへ移り始めている。OpenRouterは2026年6月13日のXスレッドでFusion APIを示し、“Fusion achieves Fable-level intelligence at half the price.”と書いた。元の投稿はXのソースツイートで確認できる。
中心にあるのはPerplexityのDRACO deep research benchmarkだ。OpenRouterは法律、医療、金融、製品比較など10領域にまたがる100件の難しい研究タスクでFusionを評価したと説明している。スレッドによれば、複数モデルのパネルは個別モデルを安定して上回り、低コストのモデル群でもClaude Fable 5に1%以内まで近づき、費用はおよそ半分だった。
Fusionは入力を複数モデルへ並列に送り、各モデルにweb searchとbash toolsを使わせる。その後、judge modelが合意点、矛盾、部分的なカバー範囲、固有の洞察、blind spotを抽出し、synthesizerが最終回答を書く。OpenRouterは性能向上のおよそ4分の3が合成処理から、残り4分の1がモデルの多様性から来たと説明した。
開発者向けには、通常のモデル呼び出しに近い形で提供される。openrouter/fusionという単一のmodel slugとして呼ぶか、tools arrayに{"type":"openrouter:fusion"}を追加して、必要な場面でモデル側にFusionを選ばせることができる。スレッドはFusionページとAPI docsにもリンクしている。
評価面では注意点もある。OpenRouterは、web searchを与えたモデルがオンライン上のDRACO rubricを見つける問題を確認し、該当ドメインを除外して再実行したと説明した。次に見るべきは独立検証だ。非公開の企業調査タスクでも、1%以内という差、半額水準の費用、回答の引用品質が再現されるかが判断材料になる。
Related Articles
HNで注目されたのは資金調達そのものより、複数モデルを束ねるゲートウェイが本当に防御力のある基盤になるかだった。
Anthropicが出したのは単なる高性能モデルではなく、同じ基盤モデルを一般向けFableと限定向けMythosに分ける配布設計だ。価格は入力$10/出力$50、危険領域ではOpus 4.8への切り替えと30日保持も組み込まれる。
r/MachineLearningで注目されたのは、閉じたモデルの評価結果をleaderboardにどう混ぜるかという現実的な問題だった。