#together-ai

AI Jul 2, 2026 1 min read

Together AI、$800M調達でopen model推論の規模競争へ

Together AIの$800M Series Cは、open-source modelを安く大規模に動かす基盤が企業AIの主戦場になったことを示す。評価額は$8.3B、前四半期のannual bookingsは$1.15B超、5年でcapacityを約50倍に広げる計画だ。

#together-ai #funding #inference

LLM X/Twitter Apr 5, 2026 1 min read

Together Research、LLMで不適切なdatabase query planを補正　最大4.78倍高速化と主張

Together Researchは、DBPlanBenchを通じてLLMがDataFusionのphysical query planを直接修正し、一部のTPC-H・TPC-DS workloadで最大4.78倍の高速化を得たと述べた。全planを再生成せず、既存planへ局所パッチを当てるのが中核だ。

#together-ai #dbplanbench #query-optimization

AI X/Twitter Apr 4, 2026 1 min read

Together AI、Wan 2.7のvideo生成・継続・編集workflowを単一APIに集約

Together AIは2026年4月3日、Alibaba CloudのWan 2.7を自社platformに導入すると発表した。併せて公開された製品記事では、text-to-videoを今すぐ提供し、image-to-video、reference-to-video、video editを同じAPI・認証・課金面に広げていく方針を示している。

#together-ai #wan-2-7 #video-generation

LLM X/Twitter Apr 1, 2026 1 min read

Together Research、RLベースのadaptive speculative decoding基盤 Aurora を公開

Together Researchは2026年3月31日、live inference traceから学習し、speculative draft modelをserving停止なしに非同期更新するopen-source frameworkのAuroraを公開した。ブログと論文によれば、Auroraはこの問題をasynchronous RLとして定式化し、traffic shift時に強いstatic speculator比で1.25xの追加高速化を示す。

#together-ai #aurora #speculative-decoding

LLM X/Twitter Mar 27, 2026 1 min read

Together Research、divide-and-conquer長文脈パイプラインがGPT-4o single-shotを上回りうると報告

Together Researchは2026年3月27日、divide-and-conquerを使う小型モデルがlong-context taskでGPT-4o single-shotを上回りうると発表した。TogetherのブログとarXiv論文によれば、この方式はplanner-worker-manager構成とtask、model、aggregator noiseの分析に基づいている。

#together-ai #long-context #multi-agent

LLM X/Twitter Mar 23, 2026 1 min read

Together AI、tool calling・reasoning・VLM fine-tuningを拡張　100B+ modelと最大6倍 throughputを支援

Together AIは2026年3月19日、自社のfine-tuningサービスがtool call、reasoning、vision-language workflowをネイティブに支援すると発表した。リンク先のTogether AIブログは、100B+ parameter model、最大100GB dataset、大規模MoE modelで最大6倍のthroughput、学習前のcost estimateと実行中のETAまで含まれると説明している。

#together-ai #fine-tuning #tool-calling

LLM X/Twitter Mar 22, 2026 1 min read

Together AI、tool calling・reasoning・VLM fine-tuning拡張　大規模MoE学習を高速化

Together AIは2026年3月19日、fine-tuningサービスがtool calling、reasoning、vision-language model学習に対応し、MoEアーキテクチャで最大6倍高いthroughputを実現すると発表した。公式記事では大規模モデル対応、100GBデータセット、事前コスト見積もり、学習中ETAも説明している。

#together-ai #fine-tuning #tool-calling

LLM Hacker News Feb 21, 2026 1 min read

HN注目: CDLMが示すブロックKVキャッシュとステップ削減で拡散LLM推論を高速化

Hacker Newsで反応を集めた投稿はTogether AIのCDLM解説を共有した。記事は、trajectory-consistentなstep削減とexact block-wise KV cachingの組み合わせにより、拡散型言語モデルで最大14.5倍のレイテンシ改善を報告している。

#diffusion-language-models #llm-inference #kv-cache