HNで浮上したAnthropic Cache TTL回帰、Claude Codeのコスト増加懸念
Original: Anthropic downgraded cache TTL on March 6th View original →
4月12日のHacker Newsでは、GitHub issue #46829をきっかけに、Claude Codeのprompt cache挙動が2026年3月初旬に大きく変わったのではないかという議論が広がった。論点はローカルのClaude Code更新ではなく、Anthropicのサーバー側デフォルトcache TTLが1時間から5分へ実質的に戻ったように見える点にある。もしこれが事実なら、長いcontextを何度も使う開発セッションのコストとquota消費はかなり重くなる。
issue投稿者は、2026年1月11日から4月11日までに2台のマシンで記録した119,866件のAPI callを分析したと説明している。Claude Codeのsession JSONLには ephemeral_5m_input_tokens と ephemeral_1h_input_tokens が別々に残るため、投稿者はそこからTTL tierの変化を読み取れると主張した。共有された表では、2月1日から3月5日まではほぼ1時間cache writeのみ、3月6日に混在が始まり、3月8日には5分cacheが優勢になったという。
このスレッドが開発者にとって重要なのは、単なる推測ではなく運用コストの問題につながるからだ。投稿ではcache creationコストが20%から32%増え、以前は上限に達しなかったsubscriptionユーザーでもquotaの消費が目立って早くなったと推定している。さらに、その挙動はClaude Codeのquota exhaustion issue #45756とも関連している可能性がある。ただし、Anthropicが意図的にデフォルトを変更したと公式に確認されたわけではない。あくまでユーザー側のtelemetryから逆算した分析であり、その点は慎重に読む必要がある。
それでも実務上の示唆は大きい。長時間のcoding sessionを回すチームは、ローカルのsession JSONLを確認し、2026年3月6日前後で5分cache writeと1時間cache writeの比率が変わっていないかを見る価値がある。もし回帰が実在するなら、model選定よりも、関連作業を短い時間帯にまとめることや、不要なcontext churnを減らすことのほうがコスト管理に直結するかもしれない。今後Anthropicが説明を出したとしても、この件は開発者ログだけでplatform economicsの変化を可視化できる好例として残りそうだ。
出典: Hacker News discussion, GitHub issue #46829, related quota issue #45756.
Related Articles
GitHub の Caveman は、冗長な説明を削って出力 token を約 75% 減らせると主張する。Hacker News では、agent のコストとレイテンシを下げる実務的な試みとして受け止められている。
Hacker Newsで拡散したAlex Kimの分析は、Claude Codeの流出source mapからfake tools、frustration regex、undercover modeといった内部設計を可視化した。論点は単なる流出ではなく、developer toolに埋め込まれたanti-distillationとtelemetryの境界にある。
GitHubは4月5日のX postでSquadを取り上げた。GitHub Copilot上に構築されたこのopen-source projectは、thin coordinator、versioned repo fileによるshared memory、parallel specialist agentという設計で、multi-agent coding workflowをより実用的にしようとしている。
Comments (0)
No comments yet. Be the first to comment!