ICLR 2026 code 공개 1,200편, r/MachineLearning의 반응은 “재현성은 별개”

r/MachineLearning에서 ICLR 2026 code/data 목록 thread가 반응을 얻은 이유는 숫자보다 재현성 논쟁이었다. 원문은 ICLR 2026 accepted papers 중 public code, data, demo link가 있는 논문 약 1,200편을 모은 목록을 소개했다. 작성자는 이것이 5,300편 이상 accepted papers의 약 22%라고 설명했고, code link는 paper submission에서 직접 추출했다고 덧붙였다.

Paper Digest 목록도 비슷하게 말한다. ICLR 2026은 2026년 4월 22일 Rio de Janeiro에서 시작하며, 이 index는 accepted papers 중 public resource가 붙은 논문을 빠르게 찾아 community engagement를 돕기 위한 것이다. 다만 목록 자체가 automated extraction process로 만들어졌고, conference 시작 전까지 일부 repository가 완전히 공개되지 않을 수 있다는 단서도 있다.

댓글의 온도는 그래서 실용적이었다. 한 연구자는 자기 논문에 공개 code와 full reproducibility가 있는데 목록에 빠졌다고 했고, 다른 이용자는 임의로 열어 본 항목의 GitHub link가 404였다고 적었다. 또 다른 댓글은 1,200개 repository 중 실제로 paper의 결과를 재현할 수 있는 비율, 문제 없이 실행되는 code의 비율이 궁금하다고 물었다. “code 공개”라는 말이 checkmark 하나로 끝나지 않는다는 반응이다.

이 thread의 의미는 ICLR의 성과를 깎아내리는 데 있지 않다. 오히려 machine learning research가 더 빨리 공유되는 만큼, 공개성의 기준도 더 세밀해져야 한다는 신호다. link 존재, license, dependency, data access, seed, training cost, evaluation script, model checkpoint는 모두 다르다. 1,200편이라는 숫자는 연구 생태계가 열린 방향으로 가고 있음을 보여주지만, r/MachineLearning의 반응은 한 단계 더 묻는다. 그 code가 실제로 다시 돌아가는가.

ICLR 2026 code 공개 1,200편, r/MachineLearning의 반응은 “재현성은 별개”

Related Articles

BMS, Vera Rubin 8랙으로 전 연구자용 drug discovery AI 공장 구축

Google DeepMind, DOE Genesis Mission에 $40M AI 크레딧 투입

초당 100,000장 실험 데이터, Meta 모델이 DOE beamline 병목으로