LLM May 5, 2026 1 min read
Sakana AI가 음성 AI의 레이턴시와 지식 품질을 동시에 해결하는 KAME(거북이) 아키텍처를 공개했다. 프론트엔드 S2S 모델과 백엔드 LLM을 탠덤으로 연결해 2.1초 파이프라인 지연 없이 MT-Bench 6.43점을 달성했다.
Sakana AI가 음성 AI의 레이턴시와 지식 품질을 동시에 해결하는 KAME(거북이) 아키텍처를 공개했다. 프론트엔드 S2S 모델과 백엔드 LLM을 탠덤으로 연결해 2.1초 파이프라인 지연 없이 MT-Bench 6.43점을 달성했다.
Sakana AI가 여러 모델을 묶는 오케스트레이션을 연구 개념이 아니라 상용 API 상품으로 꺼냈다. 베타 수치만 보면 fugu-ultra는 SWEPro 54.2, GPQAD 95.1로 GPT 5.4 high와 Gemini 3.1 high를 각각 앞서는 구간을 만들었다.