#mlperf - Insights

LLM X/Twitter Apr 10, 2026 1 min read

vLLM、初のMLPerf vision-language benchmark提出事例に参加

vLLMは、NVIDIAがQwen3-VLベースの初のMLPerf vision-language benchmark提出で同frameworkを使ったと説明した。リンク先のNVIDIA blogは、この結果をBlackwell Ultra全体の性能強化の流れに位置づけ、一部workloadで最大2.7倍のthroughputと60%以上のtoken cost削減を主張している。

#vllm #mlperf #benchmark