HNで浮上したAnthropic Cache TTL回帰、Claude Codeのコスト増加懸念
Original: Anthropic downgraded cache TTL on March 6th View original →
4月12日のHacker Newsでは、GitHub issue #46829をきっかけに、Claude Codeのprompt cache挙動が2026年3月初旬に大きく変わったのではないかという議論が広がった。論点はローカルのClaude Code更新ではなく、Anthropicのサーバー側デフォルトcache TTLが1時間から5分へ実質的に戻ったように見える点にある。もしこれが事実なら、長いcontextを何度も使う開発セッションのコストとquota消費はかなり重くなる。
issue投稿者は、2026年1月11日から4月11日までに2台のマシンで記録した119,866件のAPI callを分析したと説明している。Claude Codeのsession JSONLには ephemeral_5m_input_tokens と ephemeral_1h_input_tokens が別々に残るため、投稿者はそこからTTL tierの変化を読み取れると主張した。共有された表では、2月1日から3月5日まではほぼ1時間cache writeのみ、3月6日に混在が始まり、3月8日には5分cacheが優勢になったという。
このスレッドが開発者にとって重要なのは、単なる推測ではなく運用コストの問題につながるからだ。投稿ではcache creationコストが20%から32%増え、以前は上限に達しなかったsubscriptionユーザーでもquotaの消費が目立って早くなったと推定している。さらに、その挙動はClaude Codeのquota exhaustion issue #45756とも関連している可能性がある。ただし、Anthropicが意図的にデフォルトを変更したと公式に確認されたわけではない。あくまでユーザー側のtelemetryから逆算した分析であり、その点は慎重に読む必要がある。
それでも実務上の示唆は大きい。長時間のcoding sessionを回すチームは、ローカルのsession JSONLを確認し、2026年3月6日前後で5分cache writeと1時間cache writeの比率が変わっていないかを見る価値がある。もし回帰が実在するなら、model選定よりも、関連作業を短い時間帯にまとめることや、不要なcontext churnを減らすことのほうがコスト管理に直結するかもしれない。今後Anthropicが説明を出したとしても、この件は開発者ログだけでplatform economicsの変化を可視化できる好例として残りそうだ。
出典: Hacker News discussion, GitHub issue #46829, related quota issue #45756.
Related Articles
Anthropicは、Claude Codeの週間使用制限を7月13日まで50%引き上げると発表した。開発者がAI支援コーディングをより多く活用できる一時的な措置。
Hacker Newsで拡散したAlex Kimの分析は、Claude Codeの流出source mapからfake tools、frustration regex、undercover modeといった内部設計を可視化した。論点は単なる流出ではなく、developer toolに埋め込まれたanti-distillationとtelemetryの境界にある。
Daniel MiesslerはClaude Codeに/workflows機能が準備中だと投稿し、26万回以上閲覧された。単発プロンプトではなく、企業内SOPを反復実行する仕組みが焦点になる。