#dynamo

RSSフィード

LLM X/Twitter 5d ago 1 min read

NVIDIA ModelExpress、DeepSeek-V4 Pro起動を8分から1分台へ

大規模モデル運用の待ち時間が重み転送に集約されている。NVIDIAはModelExpressでDeepSeek-V4 Proの起動を8分から1分44秒に短縮した。

#nvidia #modelexpress #inference

LLM X/Twitter May 31, 2026 1 min read

DynoSim、60.1分の推論トラフィックを2.41秒で再現したNVIDIAの検証手法

NVIDIAはLLM推論スタックの設定探索を実機投入前に絞り込むDynoSimを示した。技術ブログでは23,608件のリクエスト、60.1分のserving windowを2.41秒で再現した例が示されている。

#nvidia #dynosim #inference

LLM Mar 30, 2026 1 min read

NVIDIA、Dynamo 1.0をAI factory向けinference OSとして本番投入

NVIDIAは2026年3月16日、generative/agentic inference向けopen-source基盤としてDynamo 1.0を発表した。Blackwell性能の引き上げ、token cost削減、主要framework統合を一体化した点が大きい。

#nvidia #dynamo #inference

AI X/Twitter Mar 17, 2026 1 min read

NVIDIA、Dynamo 1.0を AI factories 向け inference OS として production 展開

NVIDIAは2026年3月16日、Dynamo 1.0が generative・agentic inference at scale 向け open source software として production 段階に入ると発表した。NVIDIAはこのスタックが Blackwell inference 性能を最大7倍引き上げ、主要 cloud provider、inference platform、AI-native 企業群で既に支援されていると説明している。

#nvidia #dynamo #inference