Fusion API, Fable 5급 연구 성능을 절반 가격으로 겨냥
Original: OpenRouter Fusion API claims Fable-level research at half price View original →
예산 모델 패널이 연구형 LLM 가격을 다시 압박
복잡한 연구 질의에서 단일 대형 모델만 고르는 방식에 균열이 생기고 있다. OpenRouter는 2026년 6월 13일 X 스레드에서 Fusion API를 공개하며 “Fusion achieves Fable-level intelligence at half the price.”라고 적었다. 원문 트윗은 여기에서 확인할 수 있다.
스레드의 핵심 수치는 DRACO deep research benchmark다. OpenRouter는 Perplexity가 제시한 DRACO의 100개 고난도 연구 과제를 사용했고, 법률·의학·금융·제품 비교 등 10개 영역을 포함한다고 설명했다. 회사는 모델 패널이 개별 모델보다 꾸준히 낫고, 예산 모델 패널도 더 비싼 프런티어 모델에 근접하거나 넘어설 수 있다고 주장했다.
Fusion의 구조는 여러 모델을 동시에 호출한 뒤 judge model이 합의점, 모순, 누락, 고유한 통찰, blind spot을 뽑고, synthesizer가 최종 답을 만드는 방식이다. OpenRouter는 성능 향상의 약 75%가 합성 단계에서, 약 25%가 모델 다양성에서 나온다고 설명했다. 개발자는 단일 모델 슬러그처럼 openrouter/fusion을 부르거나 도구 배열에 {"type":"openrouter:fusion"}을 추가해 모델이 필요할 때 Fusion을 쓰게 할 수 있다.
OpenRouter는 DRACO 평가 중 모델이 온라인에 공개된 루브릭을 찾아내는 문제를 확인했고, 관련 도메인을 web search 설정에서 제외한 뒤 모든 수치를 다시 냈다고 덧붙였다. 다음 관전점은 외부 재현성이다. 100개 과제 결과와 비용 비교가 독립 검증에서도 유지된다면, 연구형 에이전트 시장의 경쟁축은 “가장 큰 모델”에서 “가장 잘 짜인 모델 패널”로 이동할 수 있다.
Related Articles
토큰 사용량과 투자자 구성이 함께 주목을 받았다. HN 댓글의 관심은 “모델 라우터가 독립 인프라로 남을 수 있나”에 모였다.
일반 사용자에게 풀린 것은 Fable 5지만, 핵심은 같은 기반 모델의 Mythos급 성능을 어디까지 열고 어디서 막을지다. Anthropic은 $10/$50 토큰 가격, 30일 보안 로그 보존, 일부 고위험 질의의 Opus 4.8 전환까지 함께 내놨다.
r/MachineLearning의 관심은 “코드가 없는 SOTA”를 leaderboard에 어떻게 넣을지라는 현실적인 문제에 모였다.