Show HN: 500ms未満のレイテンシを持つ音声AIエージェントをゼロから構築

400ms音声AI：何が重要か

開発者Nick Tikhonov氏がShow HNで122点を獲得したプロジェクトを公開しました。STT → LLM → TTSのフルパイプラインを含み、クリーンなバージインとプリコンピューテッドレスポンスなしで平均400msのエンドツーエンドレイテンシを達成した音声AIエージェントです。

システムは本質的に「話す」と「聞く」の2つの状態間の遷移問題に帰結します。バージイン時の即時キャンセルとターン終了時の即時応答 — この2つの遷移がユーザー体験全体を決定します。

プロジェクトはGitHub上で「shuo」として公開されています。リアルタイム音声AIシステムを構築したい開発者に実用的なリファレンスを提供します。

AI Hacker News Apr 20, 2026 1 min read

HNで400 comments超まで伸びた理由はnostalgiaではなく、AIが整ったdraftを出せる時代にstudent thinkingをどう証明するかだった。

AI Apr 20, 2026 1 min read

TNWは、GoogleがMarvellと2種類のAI chipを協議していると報じた。signed contractはまだないが、memory processing unitとinference向けTPUの構想は、AIコストの重心がtrainingからinferenceへ移ったことを示す。

AI Apr 20, 2026 1 min read

Axiosによると、NSAはAnthropicのMythos Previewを利用している。一方でPentagon幹部は同社をsupply-chain riskと見ており、AI safetyの制限と連邦政府のcybersecurity需要が衝突している。