#nvidia

RSSフィード

LLM X/Twitter 1d ago 1 min read

Nemotron 3 Nano、5ドル未満のRLで数学精度22%から91%へ

小型モデルでも短いRLループで特定タスクを大きく伸ばせる。NVIDIAはNemotron 3 Nanoが5ドル未満で数学精度を22%から91%へ上げたとした。

#nvidia #nemotron #reinforcement-learning

LLM X/Twitter 1d ago 1 min read

NVIDIA ModelExpress、DeepSeek-V4 Pro起動を8分から1分台へ

大規模モデル運用の待ち時間が重み転送に集約されている。NVIDIAはModelExpressでDeepSeek-V4 Proの起動を8分から1分44秒に短縮した。

#nvidia #modelexpress #inference

AI X/Twitter 4d ago 1 min read

Blackwell Ultra、DeepSeek-V3学習でGPU当たり1,648 TFLOPs

AIインフラ競争は、GPU確保だけでなく学習throughputで測られている。NVIDIAはBlackwell UltraがDeepSeek-V3 671BでGPU当たり1,648 TFLOPs、前世代比約3倍を記録したとした。

#nvidia #blackwell #deepseek-v3

Sciences 5d ago 1 min read

BMS、Vera Rubin 8ラックでdrug discovery用AI工場を全研究者へ

Bristol Myers Squibbは、8台のDGX Vera Rubin NVL72 systemで2基目のDGX SuperPODを導入する。既存AI clusterでtarget identificationの手作業を数週間削減した後、drug discovery全体にcomputeを広げる動きだ。

#bms #nvidia #drug-discovery

AI 5d ago 1 min read

Cosmos 3 Edge、4B世界モデルでphysical AIをedgeへ寄せる

NVIDIAのSIGGRAPH発表は、physical AIをクラウド上のデモからedge配備へ寄せる内容だった。4BのCosmos 3 Edge、Synthetic Video Detector NIM、Nemotron 3 Ultraを使うDGX Station agent stackが中心だ。

#nvidia #cosmos #physical-ai

LLM X/Twitter Jul 18, 2026 1 min read

Nemotron 3 Embed、LMEBで8B首位・1B 2位となり長期記憶検索の競争を実装現場へ拡大

NVIDIAのNemotron 3 EmbedはLMEBで8Bモデルが1位、1Bモデルが2位となり、長期会話から必要情報を拾う検索性能を押し出した。Hugging Faceの更新では8Bが64.4、1B BF16が61.5とされている。

#nvidia #nemotron #embeddings

LLM X/Twitter Jul 17, 2026 1 min read

NVIDIA Nemotron 3 Embed 8B、RTEB首位でRAG検索競争を刺激

RAGとエージェントの品質と費用は、検索モデルに強く左右される。NVIDIAはNemotron 3 Embed 8BがRTEB全体1位となり、32k contextと1B版も用意したと示した。

#nvidia #nemotron #retrieval

AI X/Twitter Jul 17, 2026 1 min read

NVIDIA DeepStream 9.1、動画AIに13個のagentic skillsを追加

動画分析パイプラインの構築は、手作業の設定から自然言語とcoding agentの組み合わせへ移り始めている。DeepStream 9.1は13個のagentic skillsとJetPack 7.2対応を含む。

#nvidia #deepstream #video-ai

Humanoid Robots sources.NVIDIA Blog Jul 16, 2026 1 min read

Jetson T3000、865 FP4 TFLOPSを小型ロボット筐体へ

NVIDIAのT3000とT2000は、Blackwell世代のedge AIをロボット本体側に寄せる新モジュールだ。865 FP4 TFLOPS、Cosmos 3 Edge、memory削減用agent skillsが、クラウドに頼れないphysical AIのコスト線を下げる。

#nvidia #jetson #robotics

AI X/Twitter Jul 15, 2026 1 min read

NVIDIA Cosmos 3、交通動画QAで54.41%から93.35%へagent後処理で改善を実証

NVIDIAはCosmos 3 Nanoを交通安全動画QA向けに後処理し、精度を54.41%から93.35%へ引き上げた。LoRAとTAO AutoMLをagentが実行する流れが焦点だ。

#nvidia #cosmos #tao

LLM X/Twitter Jul 14, 2026 1 min read

NVIDIA、LLM寸法の128・256整列でBlackwell推論の遅延とGPUボトルネックを削る設計指針

NVIDIAはLLMの寸法設計がGPU推論の処理量と遅延を左右すると示した。128倍数の整列、256・512の優先、NVFP4、MoE向け並列化が具体的な論点になる。

#nvidia #llm-inference #gpu

AI Jul 8, 2026 1 min read

NVIDIA Vera、agent loop向けCPUでx86比1.8倍のper-core性能

NVIDIAはagentic AI向けCPU Veraの詳細を示した。OlympusコアはGraceよりIPCが50%高く、agentic実行負荷でx86比1.8倍の持続per-core性能をうたう。

#nvidia #vera #ai-infrastructure