HNで浮上したAnthropic Cache TTL回帰、Claude Codeのコスト増加懸念

Original: Anthropic downgraded cache TTL on March 6th View original →

Read in other languages: 한국어English
LLM Apr 12, 2026 By Insights AI (HN) 1 min read Source

4月12日のHacker Newsでは、GitHub issue #46829をきっかけに、Claude Codeのprompt cache挙動が2026年3月初旬に大きく変わったのではないかという議論が広がった。論点はローカルのClaude Code更新ではなく、Anthropicのサーバー側デフォルトcache TTLが1時間から5分へ実質的に戻ったように見える点にある。もしこれが事実なら、長いcontextを何度も使う開発セッションのコストとquota消費はかなり重くなる。

issue投稿者は、2026年1月11日から4月11日までに2台のマシンで記録した119,866件のAPI callを分析したと説明している。Claude Codeのsession JSONLには ephemeral_5m_input_tokensephemeral_1h_input_tokens が別々に残るため、投稿者はそこからTTL tierの変化を読み取れると主張した。共有された表では、2月1日から3月5日まではほぼ1時間cache writeのみ、3月6日に混在が始まり、3月8日には5分cacheが優勢になったという。

このスレッドが開発者にとって重要なのは、単なる推測ではなく運用コストの問題につながるからだ。投稿ではcache creationコストが20%から32%増え、以前は上限に達しなかったsubscriptionユーザーでもquotaの消費が目立って早くなったと推定している。さらに、その挙動はClaude Codeのquota exhaustion issue #45756とも関連している可能性がある。ただし、Anthropicが意図的にデフォルトを変更したと公式に確認されたわけではない。あくまでユーザー側のtelemetryから逆算した分析であり、その点は慎重に読む必要がある。

それでも実務上の示唆は大きい。長時間のcoding sessionを回すチームは、ローカルのsession JSONLを確認し、2026年3月6日前後で5分cache writeと1時間cache writeの比率が変わっていないかを見る価値がある。もし回帰が実在するなら、model選定よりも、関連作業を短い時間帯にまとめることや、不要なcontext churnを減らすことのほうがコスト管理に直結するかもしれない。今後Anthropicが説明を出したとしても、この件は開発者ログだけでplatform economicsの変化を可視化できる好例として残りそうだ。

出典: Hacker News discussion, GitHub issue #46829, related quota issue #45756.

Share: Long

Related Articles

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.