r/LocalLLaMA、local AI inference 向け desk-side RISC-V box Tenstorrent QuietBox 2 に注目

Original: Tenstorrent QuietBox 2 Brings RISC-V AI Inference to the Desktop View original →

Read in other languages: 한국어English
AI Mar 14, 2026 By Insights AI (Reddit) 1 min read Source

2026年3月13日、r/LocalLLaMAではTenstorrentのTT-QuietBox 2を扱う投稿が注目を集めた。反応は local inference コミュニティらしく、curiosity、benchmark skepticism、価格計算が入り交じったものだった。2026年3月14日のcrawl時点で、このReddit postは79 upvotes、38 commentsだった。QuietBox 2が注目された理由は明快だ。これは単なる cloud appliance や datacenter rack の発表ではなく、大きな AI workload を desk-side で local に回す装置として提示されたからだ。Tenstorrentはその中で open tooling と RISC-V の立ち位置を強く押し出している。

StorageReviewによれば、この liquid-cooled workstation は最大 120 billion parameters の model を on-premises で動かすことを狙っている。Tenstorrentはこれを labs、offices、中小 businesses 向けの private inference box と位置付ける。記事によると、system は Ubuntu 24.04 を載せた状態で提供され、標準 120V outlet に接続でき、専用 rack、特殊 cooling、専用 power 設備を前提としない。価格は $9,999 からで、出荷は Q2 2026 が予定されている。

hardware claim はかなり強気だ。QuietBox 2 は4基の Blackhole ASIC を unified mesh として使い、480 Tensix cores、BlockFP8 で 2,654 TFLOPS、128 GB の GDDR6、256 GB の DDR5 system memory を備えるという。StorageReviewは、Tenstorrentが GPT-OSS 120B、reported 476.5 tokens per second の Llama 3.1 70B、Qwen3-32B coding agent、Flux の image generation、Wan 2.2 の video、Boltz-2 の biomolecular ML といった実 workload をあらかじめ示していると伝えた。会社の主張は、この装置を閉じた appliance ではなく、TT-Forge を通じて主要 framework の model を載せられる開発環境として見るべきだという点にある。

ここで効いてくるのが open stack だ。Tenstorrentは TT-Forge、TT-Metalium、TT-LLK によって model graph から kernel execution まで追跡可能な software path を提供すると説明している。opaque な accelerator stack が主流の市場では珍しい。Redditのコメントでは、標準 wall outlet 対応や初代 QuietBox より $2,000 安い点を評価する声があった一方で、無条件に受け入れられたわけではない。token-per-second の数字が実 model でも再現されるのか、Nvidia 代替と比べて価格は妥当か、bandwidth や software maintenance の懸念はどうかといった疑問がすぐに出てきた。

この緊張感こそが投稿の価値でもある。QuietBox 2は単なる hardware launch ではなく、sovereignty、inspectability、offline deployment を重視する開発者のあいだで、fully local かつより open な AI workstation が本当に支持を得られるかを試す製品だ。Tenstorrentが性能主張を再現可能な workload で裏付けられれば、LocalLLaMAの関心は既存GPU ecosystem の外にある desk-side inference の実市場へつながるかもしれない。Original source: StorageReview. Community discussion: r/LocalLLaMA.

Share: Long

Related Articles

AI sources.twitter Mar 9, 2026 1 min read

PerplexityはPerplexity Computerをtextだけでなくvoiceでも操作できるようにしたと発表した。進行中のtaskを声で修正し、方向転換できるspoken control loopがwebベースのagent workflowに入った形だ。

Comments (0)

No comments yet. Be the first to comment!

Leave a Comment

© 2026 Insights. All rights reserved.