OpenRouter、週25兆トークンでAIルーティングに$113M流入
Original: OpenRouter Raises $113 Million CapitalG-led Series B as Weekly Volume Explodes to 25T Tokens View original →
AIインフラ投資の焦点が、モデルを作る研究所だけでなく、モデル間のトラフィックを振り分ける層にも広がっている。OpenRouterは2026年5月26日、CapitalG主導の$113 million Series Bを調達した。NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures、Andreessen Horowitz、Menlo Venturesも参加している。
重要なのは調達額だけではない。OpenRouterによると、週間処理量は6カ月前の5 trillion tokensから25 trillion tokensへ5倍に増えた。月間では100 trillion tokens規模になる。同社はAnthropic、Google、OpenAI、xAI、DeepSeekなどの400以上のモデルに、単一APIからアクセスし、ルーティングし、最適化する基盤を提供する。
この伸びは、企業のAI運用が単一モデル契約から複数モデル運用へ移る流れを映している。プロダクション環境では、性能だけでなく、遅延、単価、コンテキスト長、信頼性、データ処理ポリシーをリクエストごとに見なければならない。エージェントが裏側で大量の呼び出しを行うほど、この判断は製品の中核に近づく。
OpenRouterは800万超のグローバルユーザーを抱え、公開ランキングや利用データが実際のモデル採用を見る指標として使われているとも説明する。ベンチマーク上の順位ではなく、開発者が本当に呼び出しているモデルを観測できる点が、モデル提供者、アプリ開発者、投資家、研究者をつなぐ位置を強めている。
調達資金はルーティング、ガバナンス、最適化の拡張に向かう。これは企業向けの飾りではない。複数プロバイダーをまたいでエージェントを走らせるには、リクエスト単位のポリシー、チーム別権限、利用額の可視化、障害時の切り替え、監査しやすいログが必要になる。
次の焦点は、OpenRouterが市場を測る立場と市場を動かす立場をどう両立するかだ。モデル性能が短い周期で入れ替わるほど、ルーティング層はAIインフラの重要な制御点になる。今回のラウンドは、その層が単なる開発者向け便利機能ではなく、独立した市場として評価され始めたことを示している。
Related Articles
LocalLLaMAはこれを単なるベンチ画像として流さなかった。単一のRTX 3090でQwen3.6-27Bの処理量を平均1.98倍まで押し上げ、再学習なしで長文脈も支えるという主張がスレッドの熱源になっている。
LocalLLaMAがHipfireに反応したのは、新しいrepoが出たからではない。RDNA勢が長く待っていた「最初からAMD前提」のローカル推論スタックに見えたからだ。
重要なのは、長文脈やedge-side agentを実際に回せるかどうかが結局kernel最適化で決まる場面が増えていることだ。QwenはFlashQLAがNVIDIA HopperでFLA Triton比の前方2〜3倍、逆伝播2倍を出したとしている。
Comments (0)
No comments yet. Be the first to comment!