#onnx

LLM Reddit Mar 26, 2026 1 min read

Liquid AI의 브라우저 추론 데모, LocalLLaMA가 주목한 이유

LocalLLaMA의 한 post는 Liquid AI의 LFM2-24B-A2B가 M4 Max browser에서 약 50 tokens per second로 동작한다고 주장하며 79 points와 11 comments를 모았다. Community의 관심은 sparse MoE architecture, ONNX packaging, 그리고 WebGPU가 local AI deployment target을 어디까지 넓힐 수 있는지에 집중됐다.

#liquid-ai #webgpu #onnx

AI Hacker News Mar 20, 2026 1 min read

Hacker News가 주목한 초소형 CPU용 TTS, Kitten TTS v0.8

Kitten TTS v0.8의 Show HN 글은 15M~80M ONNX 모델, 25MB급 배포 크기, CPU 중심 설계로 관심을 모았고, 실사용 품질과 데이터 출처에 대한 질문도 함께 끌어냈다.

#tts #onnx #edge-ai

AI Reddit Feb 18, 2026 1 min read

Reddit ML 사례: 동일 INT8 ONNX 모델이 Snapdragon 등급별로 큰 정확도 편차를 보인 이유

r/MachineLearning 게시물은 동일한 가중치와 ONNX export를 사용해도 Snapdragon 칩셋별 온디바이스 정확도가 91.8%~71.2%까지 크게 벌어질 수 있다고 보고했다.

#edge-ai #quantization #snapdragon