Arena、1,000万件のモデル投票を年換算$100M事業へ

無料のAIモデルランキングが、モデル経済の有料インフラに変わり始めた。UC Berkeleyの研究プロジェクトから生まれたArenaは、商用評価サービスを始めて8カ月で年換算$100Mの売上規模に到達した。

Arenaの公開サイトでは、ユーザーがプロンプトを入力し、2つのモデルの回答を比べて良い方を選ぶ。この仕組みから作られるリーダーボードは、すでに1,000万件を超えるユーザー評価を基盤にしている。モデルの実力を、ベンチマーク用の設問ではなく実際の好みで測る点に価値がある。

同社は2025年9月、AI Evaluationsという商用サービスで収益化を始めた。モデル研究所や企業に、より深い性能分析を提供する。Arenaはこの数字をARRと呼ぶが、CEOのAnastasios Angelopoulosは、古典的な継続課金ではなく使用量ベースで請求していると説明している。会計上の意味は違っても、評価データへの支出が大きな予算項目になった事実は変わらない。

背景には、モデル選定の基準が細かくなったことがある。企業は単に総合点の高いモデルを欲しいわけではない。文章、coding、vision、画像生成、長時間のagent workflowなど、自分たちの作業でどのモデルが安定して勝つかを知りたい。

Arenaは2026年1月、$1.7Bのpost-money valuationで$150MのSeries Aを調達した時点で年換算売上が$30Mだった。そこから短期間で$100Mに伸びたことは、post-trainingとモデル調達の両側で評価データの重要性が増したことを示す。次の焦点は、公開投票型のデータが企業の非公開・業務特化の評価要求にどこまで応えられるかだ。

Arena、1,000万件のモデル投票を年換算$100M事業へ

Related Articles

OpenRouter Benchmarks API、エージェントが最新モデル順位を実行時に参照可能に

Open-weight modelの差は3〜6カ月、OpenRouterが4モデルで整理

Open-weight 4モデル、安い推論から実運用エージェント基盤へ移った品質・価格競争の新局面へ