ICLR 2026 code 공개 1,200편, r/MachineLearning의 반응은 “재현성은 별개”
Original: 1,200 ICLR 2026 Papers with Public Code or Data [R] View original →
r/MachineLearning에서 ICLR 2026 code/data 목록 thread가 반응을 얻은 이유는 숫자보다 재현성 논쟁이었다. 원문은 ICLR 2026 accepted papers 중 public code, data, demo link가 있는 논문 약 1,200편을 모은 목록을 소개했다. 작성자는 이것이 5,300편 이상 accepted papers의 약 22%라고 설명했고, code link는 paper submission에서 직접 추출했다고 덧붙였다.
Paper Digest 목록도 비슷하게 말한다. ICLR 2026은 2026년 4월 22일 Rio de Janeiro에서 시작하며, 이 index는 accepted papers 중 public resource가 붙은 논문을 빠르게 찾아 community engagement를 돕기 위한 것이다. 다만 목록 자체가 automated extraction process로 만들어졌고, conference 시작 전까지 일부 repository가 완전히 공개되지 않을 수 있다는 단서도 있다.
댓글의 온도는 그래서 실용적이었다. 한 연구자는 자기 논문에 공개 code와 full reproducibility가 있는데 목록에 빠졌다고 했고, 다른 이용자는 임의로 열어 본 항목의 GitHub link가 404였다고 적었다. 또 다른 댓글은 1,200개 repository 중 실제로 paper의 결과를 재현할 수 있는 비율, 문제 없이 실행되는 code의 비율이 궁금하다고 물었다. “code 공개”라는 말이 checkmark 하나로 끝나지 않는다는 반응이다.
이 thread의 의미는 ICLR의 성과를 깎아내리는 데 있지 않다. 오히려 machine learning research가 더 빨리 공유되는 만큼, 공개성의 기준도 더 세밀해져야 한다는 신호다. link 존재, license, dependency, data access, seed, training cost, evaluation script, model checkpoint는 모두 다르다. 1,200편이라는 숫자는 연구 생태계가 열린 방향으로 가고 있음을 보여주지만, r/MachineLearning의 반응은 한 단계 더 묻는다. 그 code가 실제로 다시 돌아가는가.
Related Articles
r/MachineLearning이 반응한 이유는 숫자가 작지만 너무 익숙했기 때문이다: 한 사용자가 올해 확인한 7개 paper claim 중 4개를 재현하지 못했고, 그중 2개는 GitHub issue도 해결되지 않았다고 적었다. 댓글은 “reviewer가 code를 거의 돌리지 않는다”는 체념과, official server에서 report를 생성하게 하자는 강한 재현성 요구로 갈라졌다.
r/MachineLearning의 관심은 “적은 데이터로 배우는 AI”였지만, 댓글은 곧바로 child comparison의 전제를 검증하기 시작했다.
r/MachineLearning이 이 논문을 끌어올린 이유는 기적을 약속하지 않았기 때문이다. 딥러닝 이론이 이제는 서로 맞물리는 증거를 충분히 쌓아 하나의 과학 프로그램처럼 보이기 시작했다는 주장, 그리고 과장 대신 구조를 준 설명이 커뮤니티에 먹혔다.
Comments (0)
No comments yet. Be the first to comment!