Hacker News가 주목한 초소형 CPU용 TTS, Kitten TTS v0.8

2026년 3월 19일 Hacker News에서 눈에 띈 또 다른 글은 Kitten TTS v0.8에 대한 Show HN 포스트였다. 이 스레드는 이번 크롤링 시점 기준 308 points, 104 comments를 기록했다. 저장소 설명에 따르면 Kitten TTS는 ONNX 기반의 text-to-speech library로, 15M, 40M, 80M parameter 모델을 제공하며 디스크 기준 약 25 MB에서 80 MB 사이 크기로 CPU에서 GPU 없이 동작하는 것을 목표로 한다. 출력은 24 kHz이고 기본 voice도 8개가 포함돼 있다.

이 프로젝트가 반응을 얻은 이유는 겨냥한 문제가 분명해서다. 많은 speech 도구는 cloud 의존적이거나 GPU 중심이거나, 단순한 로컬 사용치고는 지나치게 무겁다. 반면 Kitten TTS는 작은 배포 단위, offline 실행, 단순한 Python API를 강조한다. 그래서 edge deployment, 로컬 assistant, 가벼운 desktop app 같은 용도에서 특히 관심을 끌었다.

Hacker News가 바로 시험한 부분

여러 사용자는 size 대비 음성 품질이 인상적이라고 봤고, 한 댓글은 80M 모델이 Intel 9700 CPU에서 약 1.5x realtime로 동작했다고 전했다.
동시에 숫자 읽기, 단위, voice naturalness 같은 edge case도 빠르게 검증됐고, 더 자연스러운 voice와 Japanese 지원을 요청하는 반응이 나왔다.
설치 과정에서 큰 dependency가 함께 내려온다는 지적도 있었다. 프로젝트가 "tiny"를 내세우는 만큼 packaging 경험 역시 실제 경쟁력으로 평가받고 있다는 뜻이다.

이 스레드는 오픈소스 TTS 시장이 얼마나 성숙해졌는지도 보여줬다. 단순히 작고 빠르다는 것만으로는 충분하지 않다. 일부 사용자는 voice 학습 데이터가 어디서 왔는지, 라이선스와 provenance가 어떻게 보장되는지, 그리고 실제 프로덕션 용도로 쓸 준비가 되어 있는지를 묻기 시작했다. 로컬 모델을 고르는 기준이 점점 더 현실적인 방향으로 이동하고 있다는 뜻이다.

Kitten TTS는 아직 developer preview로 표시돼 있으므로, 이번 반응은 최종 검증이라기보다 강한 초기 관심으로 읽는 편이 맞다. 그럼에도 이 포스트는 평범한 CPU에서도 돌릴 수 있고 benchmark demo를 넘어 실제로 쓸 만한 compact speech model에 대한 수요가 분명히 존재한다는 점을 보여준다.

Hacker News가 주목한 초소형 CPU용 TTS, Kitten TTS v0.8

Hacker News가 바로 시험한 부분

Related Articles

Cosmos 3 Edge, 4B world model로 edge physical AI 정조준

Reddit 주목: KittenTTS v0.8, CPU·엣지 배포를 겨냥한 초경량 오픈 TTS 스택

Mistral Voxtral TTS, open-weight speech generation을 다시 local AI stack의 중심으로

Related Articles

Cosmos 3 Edge, 4B world model로 edge physical AI 정조준

Reddit 주목: KittenTTS v0.8, CPU·엣지 배포를 겨냥한 초경량 오픈 TTS 스택
AI Reddit Feb 21, 2026 1 min read

Mistral Voxtral TTS, open-weight speech generation을 다시 local AI stack의 중심으로
AI Reddit Mar 27, 2026 1 min read