Meituan LongCat TeamがLongCat-Video-Avatar 1.5を公開した。Hugging FaceにはMITライセンス、Diffusers利用例、音声・画像・テキストから動画を作るタグが並ぶ。
#opensource
RSS FeedZOZOが布・ロープ・軟体向けの接触ソルバーを公開した。単一シーンで1.8億超の接点を扱い、BlenderアドオンとApache 2.0ライセンスも備える。
HY-World 2.0はtext、single-view image、multi-view image、videoを3D Gaussian Splatting sceneへ変換する。より重要なのは、model weights、code、technical detailsが公開される点だ。
Microsoft Researchは、長いagent trajectoryの中で最初のcritical failure stepを見つけるAgentRxを公開した。115件のfailed trajectory benchmarkとnine-category taxonomyも同時に公開し、failure localizationとroot-cause attributionの改善値を示している。
NVIDIAはKubeCon Europeで、GPU Dynamic Resource Allocation driverをCNCFとupstream Kubernetes ecosystemに移すと発表した。confidential containers、KAI Scheduler、Grove APIも合わせて示し、大規模AI cluster運用の標準化を前に進める狙いが見える。
OpenCodeをめぐるr/LocalLLaMAの議論は、provider-agnosticなコーディングエージェント、MCP設定、オープンモデルのtool calling品質という実務的な論点を浮かび上がらせた。
r/LocalLLaMAで人気を集めたこの投稿は、uncensored変更とreasoning distillationを組み合わせたQwen 3.5 9Bのコミュニティ実験を取り上げ、小型ローカルモデル調整の関心を映し出した。
Kitten TTS v0.8は、CPUで動く15Mから80MのONNX音声モデルとしてHacker Newsで注目を集め、実運用性や学習データへの質問も呼び込んだ。
Difyは2026年3月10日に3000万ドルのSeries Pre-Aを発表した。オープンソースコミュニティとenterprise展開を同時に強化しつつ、LLMクレジット拡大やworkflow・権限機能の更新も合わせて打ち出している。
r/MachineLearningの投稿(スコア71、コメント12)は、<code>Microgpt</code>に着想を得た最小構成のtext diffusion実装<code>Micro Diffusion</code>を紹介した。143行NumPy版から413行PyTorch版まで、同一diffusion loopを保ちながらdenoiserを差し替える構成が特徴。
r/LocalLLaMAの高評価投稿がHeretic 1.2を紹介。4-bit処理によるVRAM削減、MPOA導入、VL対応拡張、進捗自動保存・再開機能が主な更新点として共有された。