Skip to content

#agents

RSS Feed
AI Hacker News Mar 19, 2026 1 min read

2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。

AI Hacker News Mar 19, 2026 1 min read

2026年3月18日のNVIDIA NemoClawに関するHacker News投稿は231 points、185 commentsに達した。このalpha projectはNVIDIA OpenShellとAgent Toolkitの上にOpenClawを載せ、policy controlとcloud-routed inferenceを備えたsandboxed environmentでalways-on assistantを動かす構成を打ち出している。

AI X/Twitter Mar 18, 2026 1 min read

MistralAIは2026年3月17日、企業がproprietary knowledgeを基盤にfrontier-grade AIモデルを構築できるForgeを発表した。公式記事では、pre-training、post-training、reinforcement learning、agent-firstな設計、複数アーキテクチャ対応、規制環境向けの統制まで含む基盤として説明している。

AI X/Twitter Mar 17, 2026 1 min read

OpenAIは2026年3月9日、Promptfooを買収すると発表した。OpenAIはPromptfooの技術がOpenAI Frontierにおけるagentic security testingとevaluation能力を強化すると説明し、Promptfooは現行ライセンスのままopen sourceを維持し、既存顧客へのサポートも継続すると述べた。

LLM Mar 15, 2026 1 min read

OpenAIは2026年3月11日、AI agentが読むemail、web page、calendar inviteのようなuntrusted contentを主要なsecurity boundaryとして扱う新ガイドを公開した。堅牢なagentはdataとinstructionを分離し、least privilegeを徹底し、重要なactionの前にmonitoringとuser confirmationを入れるべきだとしている。