LLM Reddit 4h ago 1 min read Papers with Code、「codeなし」のevalも扱う時代へ r/MachineLearningで注目されたのは、閉じたモデルの評価結果をleaderboardにどう混ぜるかという現実的な問題だった。 #benchmarks#open-source#leaderboards 1