#together-ai

AI Jul 2, 2026 1 min read

Together AI, $800M 조달로 오픈소스 AI 인프라 격차 확대

$800M 시리즈C와 $8.3B 기업가치는 오픈소스 모델 운영 비용을 낮추는 인프라 경쟁이 본게임에 들어섰다는 신호다. Together AI는 지난 분기 annual bookings가 $1.15B를 넘었고, 향후 5년간 인프라 용량을 약 50배 키우겠다고 제시했다.

#together-ai #funding #inference

LLM X/Twitter Apr 5, 2026 1 min read

Together Research, LLM으로 잘못된 database query plan 보정…최대 4.78배 가속 주장

Together Research는 DBPlanBench를 통해 LLM이 DataFusion의 물리 query plan을 직접 수정해 일부 TPC-H·TPC-DS 워크로드에서 최대 4.78배 속도 향상을 냈다고 밝혔다. 핵심은 전체 plan을 다시 생성하지 않고 기존 plan에 국소 패치를 적용하는 방식이다.

#together-ai #dbplanbench #query-optimization

AI X/Twitter Apr 4, 2026 1 min read

Together AI, Wan 2.7 video 생성·연장·편집 워크플로를 단일 API로 통합

Together AI는 2026년 4월 3일 Alibaba Cloud의 Wan 2.7이 자사 플랫폼에 들어온다고 밝혔다. 함께 공개된 제품 글은 text-to-video를 지금 바로 제공하고, image-to-video·reference-to-video·video edit를 같은 API·인증·과금 표면 위로 확장하겠다고 설명한다.

#together-ai #wan-2-7 #video-generation

LLM X/Twitter Apr 1, 2026 2 min read

Together Research, RL 기반 adaptive speculative decoding 시스템 Aurora 공개

Together Research는 2026년 3월 31일 live inference trace를 학습해 speculative draft model을 serving 중단 없이 비동기적으로 갱신하는 open-source framework Aurora를 공개했다. 회사의 블로그와 논문은 Aurora가 문제를 asynchronous RL로 재정의하며, traffic shift 상황에서 강한 static speculator 대비 1.25x 추가 속도 향상을 낼 수 있다고 설명한다.

#together-ai #aurora #speculative-decoding

LLM X/Twitter Mar 27, 2026 1 min read

Together Research, divide-and-conquer long-context 파이프라인이 GPT-4o single-shot를 앞설 수 있다고 보고

Together Research는 2026년 3월 27일 divide-and-conquer를 적용한 더 작은 모델이 long-context task에서 GPT-4o single-shot를 맞추거나 앞설 수 있다고 밝혔다. Together 블로그와 arXiv 논문은 이 방법이 planner-worker-manager 구조와 task, model, aggregator noise 분석에 기반한다고 설명한다.

#together-ai #long-context #multi-agent

LLM X/Twitter Mar 23, 2026 2 min read

Together AI, tool calling·reasoning·VLM fine-tuning 확대… 100B+ 모델·최대 6배 처리량 지원

Together AI는 2026년 3월 19일 자사 fine-tuning 서비스가 tool call, reasoning, vision-language workflow를 기본 지원한다고 밝혔다. 연결된 Together AI 블로그는 100B+ parameter 모델, 최대 100GB 데이터셋, 대형 MoE 모델에서 최대 6배 처리량, 학습 전 비용 추정과 실행 중 ETA 제공까지 포함된다고 설명한다.

#together-ai #fine-tuning #tool-calling

LLM X/Twitter Mar 22, 2026 1 min read

Together AI, tool calling·reasoning·VLM fine-tuning 확대… 대형 MoE 학습 처리량 6배 향상

Together AI는 2026년 3월 19일 fine-tuning 서비스가 tool calling, reasoning, vision-language model 학습을 지원하고 MoE 아키텍처에서 최대 6배 높은 처리량을 낸다고 밝혔다. 공식 글은 최대 1T 파라미터급 모델 지원 방향과 함께 100GB 데이터셋, 사전 비용 추정, 학습 중 ETA 제공을 설명한다.

#together-ai #fine-tuning #tool-calling

LLM Hacker News Feb 21, 2026 1 min read

HN 주목: CDLM이 제시한 블록 단위 KV 캐시와 스텝 축소로 확산형 LLM 추론 가속

Hacker News 고득점 스레드는 Together AI의 CDLM 글을 공유했다. 해당 글은 확산형 언어모델에서 trajectory-consistent step reduction과 exact block-wise KV caching을 결합해 최대 14.5배 지연시간 개선을 보고한다.

#diffusion-language-models #llm-inference #kv-cache