Skip to content
腐食中

Rust製manga translator、LocalLLaMAが見たlocal OCR pipelineの手触り

Original: Local manga translator with LLM build-in, written in Rust with llama.cpp integration View original →

Read in other languages: 한국어English
LLM Apr 22, 2026 By Insights AI (Reddit) 1 min read 12 views Source

r/LocalLLaMAで注目されたRust製manga translatorは、単なるmodel demoではなくworkflowとして見えたことが強い。作者は、このprojectがmangaだけでなく一般のimage translationにも使え、object detection、visual LLM-based OCR、layout analysis、fine-tuned inpainting modelを組み合わせると説明した。LLM layerにはllama.cppを統合し、Gemma 4 familyとQwen3.5 familyをsupportする。さらにOpenAPI-compatible API経由でLM StudioやOpenRouterも使えるという。

面白いのは、ひとつのmodelが翻訳する話ではなく、複数のvision工程がeditor UXにまとまっていることだ。投稿ではbuttonを押すとpipelineが走り、結果をproofreadしてfont、size、colorを編集できるmini Photoshopのような流れが紹介された。manga translationではOCRの小さな誤りがspeech bubble、layout、redraw品質まで影響するため、完全自動よりも編集可能な結果が重要になる。repoは https://github.com/mayocream/koharu で公開されている。

  • local OCRとlayout analysisが、text areaと再描画の問題を分けて扱う。
  • llama.cpp integrationにより、cloud-onlyではなくlocal modelを主経路にできる。
  • OpenAPI-compatible pathでlocal providerとhosted providerを同じUI内で切り替えられる。

community discussion noted that users want controls as much as automation. コメントではbrowser extension、manual textbox、font customization、video demoの改善などが求められた。これは良い反応だ。単発の驚きではなく、日常のreadingやfan-translation workflowにどう入るかを想像しているからだ。local LLMは、こうした狭く具体的なcreative toolに入ったときに説得力を増す。

元threadは r/LocalLLaMA にある。

Share: Long

Related Articles

LLM Reddit May 22, 2026 1 min read

LocalLLaMAコミュニティユーザーがRTX 4070 Super 12GBでQwen3.6 35B A3BモデルをIk_llama.cppフォークを使用して110トークン/秒で実行することに成功しました。CPU オフロード最適化に優れたこのフォークは標準llama.cppより大幅に高いパフォーマンスを示しました。