Sciences Feb 16, 2026 1 min read
OpenAIは160超の政治学ジャーナルを対象に100万件超のsynthetic evaluationを実施し、再現研究の優先順位づけ手法を公開した。モデル予測と実測結果の不一致を、再検証価値の高い研究の発見に使う設計だ。
OpenAIは160超の政治学ジャーナルを対象に100万件超のsynthetic evaluationを実施し、再現研究の優先順位づけ手法を公開した。モデル予測と実測結果の不一致を、再検証価値の高い研究の発見に使う設計だ。