#nvidia

RSS 피드

LLM X/Twitter 1d ago 1 min read

Nemotron 3 Nano, 5달러 미만 RL로 수학 정확도 22%에서 91%까지 상승

소형 오픈 모델도 짧은 RL 루프로 특정 과제 성능을 크게 끌어올릴 수 있다는 신호다. NVIDIA는 Nemotron 3 Nano가 5달러 미만 실험에서 22%에서 91%로 올랐다고 전했다.

#nvidia #nemotron #reinforcement-learning

LLM X/Twitter 1d ago 1 min read

NVIDIA ModelExpress, DeepSeek-V4 Pro 기동 시간을 8분에서 1분대로 단축

대형 모델 서빙의 병목이 가중치 이동으로 좁혀졌다. NVIDIA는 ModelExpress로 DeepSeek-V4 Pro 시작 시간을 8분에서 1분 44초 수준으로 줄였다고 밝혔다.

#nvidia #modelexpress #inference

AI X/Twitter 4d ago 1 min read

Blackwell Ultra, DeepSeek-V3 학습서 GPU당 1,648 TFLOPs

AI 인프라 경쟁은 모델 크기만큼 학습 처리량 숫자로 움직인다. NVIDIA는 Blackwell Ultra가 DeepSeek-V3 671B 사전학습에서 GPU당 1,648 TFLOPs를 기록해 이전 세대 대비 약 3배 성능을 냈다고 밝혔다.

#nvidia #blackwell #deepseek-v3

Sciences 5d ago 1 min read

BMS, Vera Rubin 8랙으로 전 연구자용 drug discovery AI 공장 구축

Bristol Myers Squibb가 8대 DGX Vera Rubin NVL72 기반 두 번째 DGX SuperPOD를 도입해 전 세계 연구자가 쓰는 단일 AI 환경을 만든다. 기존 AI cluster에서 target identification 시간을 몇 주 줄인 뒤, drug discovery 전 과정으로 compute를 확대하는 결정이다.

#bms #nvidia #drug-discovery

AI 5d ago 1 min read

Cosmos 3 Edge, 4B world model로 edge physical AI 정조준

로봇과 영상 검증을 클라우드 밖으로 밀어내는 숫자가 나왔다. NVIDIA는 SIGGRAPH에서 4B Cosmos 3 Edge, Synthetic Video Detector NIM, DGX Station용 Nemotron 3 Ultra 스택을 한꺼번에 공개하며 physical AI의 배포 지점을 edge와 로컬 워크스테이션으로 좁혔다.

#nvidia #cosmos #physical-ai

LLM X/Twitter Jul 18, 2026 1 min read

Nemotron 3 Embed, LMEB에서 8B 1위·1B 2위로 장기 기억 검색 경쟁 가속

NVIDIA의 Nemotron 3 Embed가 LMEB에서 8B 모델 1위, 1B 모델 2위를 기록하며 에이전트 기억 검색 경쟁을 넓혔다. Hugging Face 글에 따르면 8B는 LMEB 64.4, 1B BF16은 61.5를 기록해 장기 대화 검색 성능을 전면에 세웠다.

#nvidia #nemotron #embeddings

LLM X/Twitter Jul 17, 2026 1 min read

NVIDIA Nemotron 3 Embed 8B, RTEB 1위로 RAG 검색 경쟁 압박

RAG와 에이전트의 품질 병목이 검색 모델로 이동하고 있다. NVIDIA는 Nemotron 3 Embed 8B가 RTEB 전체 1위에 올랐고 32k context와 1B 변형을 함께 제공한다고 밝혔다.

#nvidia #nemotron #retrieval

AI X/Twitter Jul 17, 2026 1 min read

NVIDIA DeepStream 9.1, 영상 AI 파이프라인에 13개 agentic skills 추가

영상 분석 파이프라인 구축이 코드 중심 작업에서 자연어 지시와 coding agent 조합으로 이동하고 있다. NVIDIA DeepStream 9.1은 13개 agentic skills와 JetPack 7.2 지원을 포함한다.

#nvidia #deepstream #video-ai

Humanoid Robots sources.NVIDIA Blog Jul 16, 2026 1 min read

Jetson T3000, 로봇용 Blackwell을 절반 전력대로 낮춘 카드

865 FP4 TFLOPS를 절반 크기·전력대에 넣은 Jetson T3000이 로봇 엣지 AI의 비용선을 낮춘다. Cosmos 3 Edge와 agent skills까지 묶이며 휴머노이드와 산업용 로봇의 온디바이스 추론 경쟁이 더 가까워졌다.

#nvidia #jetson #robotics

AI X/Twitter Jul 15, 2026 1 min read

NVIDIA Cosmos 3, 교통 영상 QA 정확도 54.41%에서 93.35%로 상승한 결과

NVIDIA가 Cosmos 3 Nano를 교통 안전 영상 QA에 맞춰 후처리해 정확도를 54.41%에서 93.35%까지 끌어올린 결과를 공개했다. agent가 LoRA와 AutoML을 실행한 점이 핵심이다.

#nvidia #cosmos #tao

LLM X/Twitter Jul 14, 2026 1 min read

NVIDIA, LLM 차원 128·256 정렬로 GPU 추론 병목과 지연시간 줄이는 설계 원칙

NVIDIA가 LLM 구조를 GPU tile 크기에 맞추는 설계 원칙을 제시했다. 128 배수 정렬, 256·512 선호, NVFP4와 expert parallelism이 처리량과 지연시간을 함께 좌우한다는 내용이다.

#nvidia #llm-inference #gpu

AI Jul 8, 2026 1 min read

NVIDIA Vera, agent loop용 CPU에서 x86 대비 1.8배 per-core 성능

NVIDIA가 agentic AI용 CPU Vera의 성능 근거를 공개했다. Olympus 코어는 Grace보다 IPC가 50% 높고, agentic 실행 부하에서 x86 대비 지속 per-core 성능 1.8배를 제시했다.

#nvidia #vera #ai-infrastructure