LLM Reddit Feb 19, 2026 1 min read
LocalLLaMA 인기 글은 13.6M 파라미터 matmul-free 모델을 2스레드 CPU에서 약 1.2시간 만에 학습했다고 보고했다. 작성자는 연산 병목이 ternary 코어가 아니라 출력 헤드에 집중된다고 주장했다.
LocalLLaMA 인기 글은 13.6M 파라미터 matmul-free 모델을 2스레드 CPU에서 약 1.2시간 만에 학습했다고 보고했다. 작성자는 연산 병목이 ternary 코어가 아니라 출력 헤드에 집중된다고 주장했다.