Hacker News、macOS向け完全ローカル speech-to-text「Ghost Pepper」に注目

Show HNスレッドでGhost Pepperが響いた理由はシンプルだ。coding や writing のループに voice input を入れるなら、最も摩擦の少ない形は音声が laptop の外へ出ない方式かもしれない、という点である。投稿者は Ghost Pepper を、Control キーを押している間だけ録音し、離すと文字起こししてそのまま貼り付ける 100% local の macOS speech-to-text utility として紹介した。この前提は 440ポイントと191コメントを集め、小さな utility launch を超えて privacy 重視の desktop tooling 議論へ広がった。

GitHub README は stack をかなり具体的に示している。Ghost Pepper は Apple Silicon 向け macOS 14.0+ を対象にし、menu bar app として動き、必要な model をローカルに download して cache する。speech 側では Whisper tiny.en、Whisper small.en、multilingual Whisper small、そして FluidAudio 経由の Parakeet v3 をサポートする。cleanup には LLM.swift 経由の local Qwen 3.5 model を使い、filler words を除去し self-correction を整えたうえで、現在の text field に貼り付ける。保存まわりの説明も明確で、transcription は disk に log されず、debug logs も app 終了時に消える memory 上だけに残るという。

この組み合わせこそが HN で意味を持った。多くの AI voice 製品はいまだに audio を remote API へ送り、local と cloud の境界も曖昧なままだ。Ghost Pepper は代わりに、WhisperKit による transcription、LLM.swift による cleanup、Hugging Face-hosted download、そして microphone と Accessibility の macOS permission model をかなり透明に見せている。venture-backed assistant というより、現在の local-model ecosystem の上で組み上げられた open desktop utility に近い。

HNが反応した理由

慣れた global hotkey 操作を、cloud transcription subscription ではなく on-device AI workflow に変えている。
対応 model 一覧が、高速な English-only option、大きな multilingual option、複数の cleanup-model size という tradeoff を明示している。
privacy の主張が marketing 文句ではなく、model が local 実行され transcription を disk に書かないと README に書かれている。

Ghost Pepper は汎用 agent を目指しているわけではない。それでも HN の反応は、agent 時代の道具市場が巨大な assistant だけを求めているわけではないことを示している。keyboard、voice、local models を同じ workflow で混ぜて使う開発者が増えるほど、Ghost Pepper のような project は side demo より実用的な building block として見られやすくなる。

Hacker News、macOS向け完全ローカル speech-to-text「Ghost Pepper」に注目

HNが反応した理由

Related Articles

Grok Buildベータ、X Premium+とSuperGrok全体へ開放

スタートアップShift、無料清掃提供でロボット訓練データを収集

Hermes Agent v0.15.0、747件のPRと750倍速いセッション検索を加えた技術的意味

Comments (0)

Leave a Comment