#agents

RSS Feed
LLM sources.twitter Mar 21, 2026 1 min read

Ollamaは2026年3月18日、MiniMax-M2.7をcloud経由で提供し、Claude CodeとOpenClawから起動できると発表した。Ollamaのライブラリページは、このモデルをcoding・agent workflow・professional productivity向けと位置づけ、SWE-Pro、VIBE-Pro、Terminal Bench 2、GDPval-AA、Toolathonの成績を示している。

LLM Mar 19, 2026 1 min read

OpenAIは2026年3月19日、GPT-5.4 Thinkingベースの仕組みで内部coding agentの行動とchain of thoughtを30分以内にレビューする監視体制を公開した。OpenAIは、この仕組みがすでに数千万件のtrajectoryを処理しており、ユーザー意図や社内ポリシーから外れる振る舞いを捉えるためのものだと説明している。

AI Hacker News Mar 19, 2026 1 min read

2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。

© 2026 Insights. All rights reserved.