DeepSeek、全APIの入力キャッシュ料金を10分の1へ下げAPI推論コスト競争の本格化を後押し
Original: DeepSeek Input Cache Price Drop View original →
DeepSeekは短い価格投稿で、推論コスト競争の焦点をはっきり示した。入力キャッシュヒットの料金を全API系列で従来の10分の1に下げるという内容だ。ここが重要なのは、長いシステムプロンプト、繰り返し使うRAGの接頭文、複数ターンで持ち回る指示文などでは、出力トークン単価よりキャッシュ料金の方が実運用コストを左右する場面が多いからだ。コーディング支援や企業チャット、エージェント型ワークロードほど影響は大きい。
“Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price… The DeepSeek-V4-Pro 75% OFF promotion is still active.”
注目点は適用範囲にある。特定の主力モデルだけでも、短期ベータ枠だけでもなく、「ENTIRE DeepSeek API series」という書き方をしている。つまり今回の値下げは、単発キャンペーンではなく製品群全体の競争姿勢として打ち出された。90%の引き下げがそのまま維持されるなら、開発者は毎回プロンプトを削るより、検証済みの指示ブロックやセッション文脈を長く再利用する設計を取りやすくなる。長文コンテキスト中心の製品では、その違いがそのまま原価差になる。
deepseek_aiはDeepSeekの公式アカウントで、X上ではモデル更新やAPI変更を素早く流す役割を担っている。今回の投稿は論文やリポジトリではなく公式サイトへの導線だけを置いており、主役は技術仕様ではなく価格シグナルだ。同時にV4-Proの75%割引継続も入れており、通常価格の引き下げと販促を重ねて利用者獲得を狙う構図が見える。
次に確認すべきなのは、公式価格表での反映、キャッシュヒットの定義、上限や例外の有無だ。ただ、それでも「10分の1」という数字は十分に大きい。競合各社が同じ項目で追随するか、長文コンテキストの仕事がどれだけDeepSeek側へ流れるかがすぐ次の見どころになる。出典: 元ツイート.
Related Articles
DeepSeekはV4-Pro APIの75%割引を恒久価格に切り替え、LLM APIの価格競争を一段押し下げた。投稿画像では出力単価が100万トークンあたり$3.48から$0.87に下がる。
xAIがGrok Build CLIの基盤モデルをAPI betaとして開いた。入力100万トークン$1、出力100万トークン$2という価格は、長時間動くコーディングエージェントの費用構造に直接響く。
オープンモデル競争は順位表だけでなく、長時間エージェントの運用コストへ移っている。NVIDIAはNemotron 3 Ultraについて、5倍高速な推論と最大30%低い複雑タスク費用を示した。