#reproducibility

Sciences Reddit Apr 22, 2026 1 min read

ICLR 2026 code 공개 1,200편, r/MachineLearning의 반응은 “재현성은 별개”

r/MachineLearning은 1,200편 목록을 유용한 출발점으로 보면서도, 곧바로 “link가 있다”와 “재현 가능하다”는 다르다고 짚었다. 댓글들은 누락, 404, 실행 불가능한 code까지 연구 공개의 현실적인 마찰을 꺼냈다.

#iclr #ml-research #reproducibility

Sciences Reddit Apr 17, 2026 1 min read

7개 논문 claim 중 4개 재현 실패, r/MachineLearning이 다시 뜨거워졌다

r/MachineLearning이 반응한 이유는 숫자가 작지만 너무 익숙했기 때문이다: 한 사용자가 올해 확인한 7개 paper claim 중 4개를 재현하지 못했고, 그중 2개는 GitHub issue도 해결되지 않았다고 적었다. 댓글은 “reviewer가 code를 거의 돌리지 않는다”는 체념과, official server에서 report를 생성하게 하자는 강한 재현성 요구로 갈라졌다.

#machine-learning #reproducibility #research

AI Reddit Mar 13, 2026 1 min read

‘Shadow API’가 LLM 연구 재현성을 무너뜨린다는 경고

r/MachineLearning에서 공유된 새 arXiv 논문은 unofficial model access provider가 연구 결과와 운영 신뢰성을 모두 흔들 수 있다고 지적한다.

#reproducibility #apis #research

LLM Reddit Mar 11, 2026 1 min read

r/MachineLearning이 환기한 Shadow API 재현성 리스크

r/MachineLearning에서 다시 주목받은 arXiv 2603.01919는 GPT-5와 Gemini-2.5 접근을 내세우는 shadow API를 감사해 큰 성능 편차, 불안정한 safety 동작, 빈번한 model identity 실패를 보고했다.

#shadow-apis #reproducibility #api-integrity

Sciences Feb 16, 2026 1 min read

OpenAI, 160+ 정치학 저널·100만+ synthetic eval로 사회과학 재현연구 우선순위화

OpenAI는 160개 이상 정치학 저널 논문을 대상으로 100만 건 이상 synthetic evaluation을 수행해 재현연구 후보를 선별하는 방법을 공개했다. 논문 제목·초록 기반 예측과 실제 표본 결과의 불일치를 활용해, 검증 가치가 높은 연구를 찾는 접근이다.

#openai #social-science #reproducibility