LLM Hacker News 5h ago 1 min read FrontierCode, “테스트 통과”보다 “merge할 코드인가”를 묻는 평가 코딩 모델 평가가 정답률에서 코드 리뷰 품질로 옮겨가고 있다는 점에 HN 관심이 모였다. FrontierCode는 PR을 실제 maintainer가 받아들일지에 초점을 둔다. #coding-agents#benchmark#evals 1