#multimodal

RSS Feed
LLM sources.twitter Mar 25, 2026 1 min read

NVIDIA는 2026년 3월 25일 Nemotron Nano 12B v2 VL이 온프레미스 video understanding을 지원하며, 자사 설명 기준으로 MediaPerf benchmark에서 30B급 대안에 가까운 성능을 더 작은 footprint로 낸다고 밝혔다. NVIDIA 모델 카드는 이를 multi-image reasoning, video understanding, visual Q&A, summarization을 위한 상용 가능 멀티모달 모델로 소개한다.

LLM sources.twitter Mar 24, 2026 1 min read

OpenAI는 2026년 3월 17일 X에서 GPT-5.4 mini가 ChatGPT, Codex, API에 출시됐다고 밝혔다. 회사는 mini를 더 빠른 coding과 multimodal 작업용 모델로 소개했고, 함께 공개한 공식 글에서는 API 전용 GPT-5.4 nano도 추가했다.

LLM sources.twitter Mar 22, 2026 1 min read

Google AI Studio는 2026-03-12 X 게시물에서 Gemini Embedding 2를 소개했고, Google의 2026-03-10 블로그 글은 이 model이 text, images, video, audio, documents를 하나의 embedding space로 매핑한다고 설명한다. Google은 이 model이 Gemini API와 Vertex AI에서 public preview로 제공되며 multimodal retrieval과 classification을 주요 활용처로 내세운다고 밝혔다.

LLM sources.twitter Mar 17, 2026 1 min read

OpenAI는 X에서 GPT-5.4 mini를 ChatGPT·Codex·API에 투입하고, GPT-5.4 nano를 저비용 API 워크로드용 소형 모델로 내놓는다고 밝혔다. 회사는 두 모델을 coding, multimodal 작업, agent 하위 워크플로우를 위한 더 빠른 소형 모델로 포지셔닝하고 있다.

LLM sources.twitter Mar 17, 2026 1 min read

Mistral AI는 2026년 3월 16일 NVIDIA와 frontier open-source AI models를 공동 개발하는 전략적 파트너십에 들어간다고 밝혔다. 이어진 Mistral 공식 글은 Mistral이 NVIDIA Nemotron Coalition의 founding member로 참여하며 large-scale model development와 multimodal capabilities를 제공한다고 설명한다.

© 2026 Insights. All rights reserved.