LLM Feb 19, 2026 2 min read
NVIDIA는 2026년 2월 12일, Baseten·DeepInfra·Fireworks AI·Together AI가 Blackwell 기반 추론 스택으로 token cost를 크게 낮추고 있다고 밝혔다. 발표에는 Hopper 대비 최대 10배 절감, 개별 고객사별 지연시간·비용 개선 수치가 포함됐다.
NVIDIA는 2026년 2월 12일, Baseten·DeepInfra·Fireworks AI·Together AI가 Blackwell 기반 추론 스택으로 token cost를 크게 낮추고 있다고 밝혔다. 발표에는 Hopper 대비 최대 10배 절감, 개별 고객사별 지연시간·비용 개선 수치가 포함됐다.