Skip to content

#maintainability

RSS Feed
AI Hacker News Mar 8, 2026 1 min read

Hacker Newsで注目を集めたSWE-CIは、one-shot bug fixではなく実リポジトリの長期進化に沿ってcoding agentを評価するarXiv benchmarkだ。論文はsoftware maintainabilityをCI loopの問題として捉え直し、強いmodelでも長期区間ではregression抑制に苦戦すると報告している。