LLM X/Twitter 5h ago 1 min read GLM 5.2、Vibe Code Bench 64%でオープンモデルの実用差を縮める新たな評価基準 オープンウェイトのコーディングモデルが実用評価で一段上の水準に入った。Vals AIは、GLM 5.2がVibe Code Bench v1.1で64%を記録し、次のオープンモデルを14ポイント上回ったとしている。 #glm-5-2#open-weights#benchmark 1