DeepSeek、全APIの入力キャッシュ料金を10分の1へ下げAPI推論コスト競争の本格化を後押し

DeepSeekは短い価格投稿で、推論コスト競争の焦点をはっきり示した。入力キャッシュヒットの料金を全API系列で従来の10分の1に下げるという内容だ。ここが重要なのは、長いシステムプロンプト、繰り返し使うRAGの接頭文、複数ターンで持ち回る指示文などでは、出力トークン単価よりキャッシュ料金の方が実運用コストを左右する場面が多いからだ。コーディング支援や企業チャット、エージェント型ワークロードほど影響は大きい。

“Effective immediately, the price for input cache hits across the ENTIRE DeepSeek API series is reduced to just 1/10th of the original price… The DeepSeek-V4-Pro 75% OFF promotion is still active.”

注目点は適用範囲にある。特定の主力モデルだけでも、短期ベータ枠だけでもなく、「ENTIRE DeepSeek API series」という書き方をしている。つまり今回の値下げは、単発キャンペーンではなく製品群全体の競争姿勢として打ち出された。90%の引き下げがそのまま維持されるなら、開発者は毎回プロンプトを削るより、検証済みの指示ブロックやセッション文脈を長く再利用する設計を取りやすくなる。長文コンテキスト中心の製品では、その違いがそのまま原価差になる。

deepseek_aiはDeepSeekの公式アカウントで、X上ではモデル更新やAPI変更を素早く流す役割を担っている。今回の投稿は論文やリポジトリではなく公式サイトへの導線だけを置いており、主役は技術仕様ではなく価格シグナルだ。同時にV4-Proの75%割引継続も入れており、通常価格の引き下げと販促を重ねて利用者獲得を狙う構図が見える。

次に確認すべきなのは、公式価格表での反映、キャッシュヒットの定義、上限や例外の有無だ。ただ、それでも「10分の1」という数字は十分に大きい。競合各社が同じ項目で追随するか、長文コンテキストの仕事がどれだけDeepSeek側へ流れるかがすぐ次の見どころになる。出典: 元ツイート.

DeepSeek、全APIの入力キャッシュ料金を10分の1へ下げAPI推論コスト競争の本格化を後押し

Related Articles

DeepSeek V4-ProのAPI価格75%引き下げ、期間限定割引が標準価格に

grok-build-0.1 API beta、100万トークン$1/$2でコーディングAIを価格競争へ

Nemotron 3 Ultra、550B MoEでエージェント推論5倍と30%コスト削減を提示