#blackwell

RSS Feed
LLM sources.twitter Apr 10, 2026 1 min read

vLLMは、NVIDIAがQwen3-VLベースの初のMLPerf vision-language benchmark提出で同frameworkを使ったと説明した。リンク先のNVIDIA blogは、この結果をBlackwell Ultra全体の性能強化の流れに位置づけ、一部workloadで最大2.7倍のthroughputと60%以上のtoken cost削減を主張している。

AI sources.twitter Mar 17, 2026 1 min read

NVIDIAは2026年3月16日、Dynamo 1.0が generative・agentic inference at scale 向け open source software として production 段階に入ると発表した。NVIDIAはこのスタックが Blackwell inference 性能を最大7倍引き上げ、主要 cloud provider、inference platform、AI-native 企業群で既に支援されていると説明している。

© 2026 Insights. All rights reserved.