Hacker News가 이 논문에 반응한 이유는 새 benchmark가 아니라, 딥러닝이 이제는 과학 이론의 대상이 될 수 있다는 큰 주장 때문이었다. 흥분과 회의가 동시에 붙으면서 스레드가 오래 이어졌다.
#arxiv
RSS Feed새 arXiv 논문은 낮은 평균 오류율 뒤에 LLM judge의 per-document 불안정성이 숨어 있음을 보였다. SummEval에서 문서 33-67%가 directed 3-cycle을 하나 이상 보였고, prediction set width는 absolute error와 강하게 맞물렸다.
MegaTrain은 parameters와 optimizer states를 host memory에 두고 layer를 GPU로 streaming하는 방식으로, 단일 GPU에서 100B+ 파라미터 LLM의 full precision 학습을 겨냥한다. 최근 Hacker News에서 이 논문이 주목받은 이유는 training bottleneck을 GPU 수량이 아니라 memory system 설계 문제로 다시 정의하기 때문이다.
Emmanuel Dupoux, Yann LeCun, Jitendra Malik의 새 arXiv paper가 Hacker News 전면에 오르며, 현재 AI가 왜 autonomous learning에 아직 도달하지 못했는지와 observation·active behavior·meta-control 구조를 제안했다.
2026년 3월 9일 제출된 arXiv 논문 Ares는 multi-step LLM agent에서 단계별 reasoning effort를 동적으로 조절하는 방식을 제안했다. 저자들은 fixed high-effort 대비 reasoning token 사용량을 최대 52.7% 줄이면서 성공률 저하는 작았다고 보고했다.
한 Reddit 스레드는 arXiv 논문 2603.10145를 끌어올렸고, 이 논문은 language model의 output layer가 단순한 softmax expressivity 문제가 아니라 gradient norm의 95~99%를 억제하는 optimization bottleneck일 수 있다고 주장한다. 토론은 더 나은 head 설계가 LLM 학습 효율을 크게 바꿀 수 있는지에 집중됐다.
r/singularity에서 H-Neurons 논문이 빠르게 확산됐다. 논문 초록은 전체 뉴런의 0.1% 미만으로 환각 발생을 예측할 수 있으며, 개입 실험에서 인과적 연관성을 보였다고 주장한다.
r/singularity 고반응 게시물은 arXiv 2602.15322를 공유했다. 논문은 masked adaptive update와 Magma 기법이 1B 모델 설정에서 Adam·Muon 대비 perplexity를 개선하면서 오버헤드는 작다고 보고한다.
Hacker News에서 주목받은 arXiv 논문 2602.10177은 Aletheia라는 수학 연구 에이전트를 소개한다. 저자들은 IMO 수준 추론에서 출발해 PhD 수준 문제와 공개 난제 탐색까지 확장된 워크플로를 제시했다.