HN 스포트라이트: Sarvam, IndiaAI 기반의 풀스택 전략으로 30B·105B 공개

Hacker News에서는 2026년 3월 6일 Sarvam AI가 Sarvam 30B와 Sarvam 105B를 오픈소스로 공개했다는 발표가 빠르게 확산됐다. 회사 설명에 따르면 두 모델은 IndiaAI mission이 제공한 compute 위에서 인도 내에서 처음부터 학습된 reasoning 중심 모델이다. 발표의 초점은 단순한 model release가 아니라 data curation, training, inference optimization, tokenizer, product deployment까지 포함한 full stack 역량을 함께 보여주는 데 있다.

기술 구성도 비교적 구체적이다. 두 모델 모두 128 experts를 사용하는 sparse MoE Transformer backbone을 채택한다. Sarvam 30B는 KV-cache 사용량을 줄이기 위해 Grouped Query Attention을 사용하고, Sarvam 105B는 긴 context에서 메모리 효율을 더 끌어올리기 위해 Multi-head Latent Attention을 사용한다. Sarvam은 30B가 16T tokens, 105B가 12T tokens로 학습됐다고 밝히며, code, web data, mathematics, multilingual content, synthetic data를 함께 섞은 학습 구성을 강조했다. 또한 12개 scripts에 걸친 22개 scheduled Indian languages용 tokenizer 최적화도 전면에 내세웠다.

Hacker News에서 반응을 키운 것은 benchmark 숫자들이다. Sarvam 105B는 reasoning, coding, agentic workloads를 겨냥한 competitive open model로 소개되며 LiveCodeBench v6 71.7, MMLU 90.6, AIME 25 Pass@1 88.3, Tau2 average 68.3 같은 수치를 제시한다. Sarvam 30B는 2.4B active parameters 기반의 효율 중심 모델로 설명되며 HumanEval, MBPP, BrowseComp, Tau2에서 강한 결과를 내세운다. 회사는 이미 30B가 Samvaad를, 105B가 Indus를 구동하고 있다고 밝힌다.

이번 공개가 특히 눈에 띄는 이유는 운영 관점의 이야기까지 포함하고 있기 때문이다. 발표문은 fused kernels, scheduling, disaggregated serving, 그리고 H100, L40S, Apple Silicon에서의 throughput 개선을 길게 설명한다. 즉 Sarvam은 weights만 공개하는 것이 아니라, 실제 workload와 regional language coverage에 맞게 inference stack을 튜닝할 때 open model의 가치가 커진다고 주장하고 있다.

빌더 입장에서 핵심은 분명하다. 이것은 reasoning quality, agentic utility, serving efficiency를 동시에 경쟁력으로 만들려는 sovereign-model 시도다. Hacker News의 관심은 결국 같은 질문을 향한다. 지역 기반 모델 랩이 headline parameter 수치 경쟁이 아니라 전체 pipeline 소유를 통해 차별화할 수 있는가 하는 점이다.

원문: Sarvam AI release post.

HN 스포트라이트: Sarvam, IndiaAI 기반의 풀스택 전략으로 30B·105B 공개

Related Articles

Mistral, reasoning·coding·multimodal 통합한 오픈소스 모델 Mistral Small 4 공개

Browser Harness에 HN 반응, "브라우저 도구를 중간에 스스로 고친다"

Hacker News가 주목한 Nanocode, 약 200달러로 Claude Code 스타일 model을 훈련하는 JAX·TPU 청사진

Comments (0)

Leave a Comment

Related Articles

Mistral, reasoning·coding·multimodal 통합한 오픈소스 모델 Mistral Small 4 공개
LLM Mar 29, 2026 1 min read

Browser Harness에 HN 반응, "브라우저 도구를 중간에 스스로 고친다"

Hacker News가 주목한 Nanocode, 약 200달러로 Claude Code 스타일 model을 훈련하는 JAX·TPU 청사진
LLM Hacker News Apr 6, 2026 1 min read