Together Researchは、DBPlanBenchを通じてLLMがDataFusionのphysical query planを直接修正し、一部のTPC-H・TPC-DS workloadで最大4.78倍の高速化を得たと述べた。全planを再生成せず、既存planへ局所パッチを当てるのが中核だ。
Together Researchは、DBPlanBenchを通じてLLMがDataFusionのphysical query planを直接修正し、一部のTPC-H・TPC-DS workloadで最大4.78倍の高速化を得たと述べた。全planを再生成せず、既存planへ局所パッチを当てるのが中核だ。
Together AIは2026年4月3日、Alibaba CloudのWan 2.7を自社platformに導入すると発表した。併せて公開された製品記事では、text-to-videoを今すぐ提供し、image-to-video、reference-to-video、video editを同じAPI・認証・課金面に広げていく方針を示している。
Together Researchは2026年3月31日、live inference traceから学習し、speculative draft modelをserving停止なしに非同期更新するopen-source frameworkのAuroraを公開した。ブログと論文によれば、Auroraはこの問題をasynchronous RLとして定式化し、traffic shift時に強いstatic speculator比で1.25xの追加高速化を示す。
Together Researchは2026年3月27日、divide-and-conquerを使う小型モデルがlong-context taskでGPT-4o single-shotを上回りうると発表した。TogetherのブログとarXiv論文によれば、この方式はplanner-worker-manager構成とtask、model、aggregator noiseの分析に基づいている。
Together AIは2026年3月19日、自社のfine-tuningサービスがtool call、reasoning、vision-language workflowをネイティブに支援すると発表した。リンク先のTogether AIブログは、100B+ parameter model、最大100GB dataset、大規模MoE modelで最大6倍のthroughput、学習前のcost estimateと実行中のETAまで含まれると説明している。
Together AIは2026年3月19日、fine-tuningサービスがtool calling、reasoning、vision-language model学習に対応し、MoEアーキテクチャで最大6倍高いthroughputを実現すると発表した。公式記事では大規模モデル対応、100GBデータセット、事前コスト見積もり、学習中ETAも説明している。
Hacker Newsで反応を集めた投稿はTogether AIのCDLM解説を共有した。記事は、trajectory-consistentなstep削減とexact block-wise KV cachingの組み合わせにより、拡散型言語モデルで最大14.5倍のレイテンシ改善を報告している。