Hacker NewsはMicrosoftのbitnet.cppを再浮上させ、新しい100B checkpointというよりも、1.58-bit inferenceと省電力なlocal LLM運用へ向けたinfra更新として受け止めた。
LLM
RSS FeedMicrosoftは、Fireworks AIがMicrosoft Foundryに加わり、Azureでhigh-performanceかつlow-latencyなopen model inferenceを提供すると発表した。day-zero access、custom model持ち込み、enterprise controlを一体で扱える点が中核だ。
Launch HNスレッドはRunAnywhereのMetalRTとRCLIを押し上げ、Apple Silicon上でSTT・LLM・TTSをクラウドなしでつなぐ低遅延音声AIスタックに注目を集めた。
r/MachineLearningで再注目されたarXiv 2603.01919は、GPT-5やGemini-2.5へのアクセスをうたうshadow APIを監査し、大きな性能乖離、不安定なsafety挙動、頻繁なmodel identity failureを報告した。
Launch HNスレッドでRunAnywhereのRCLIが可視化された。Apple Silicon上でSTT、LLM、TTS、ローカルRAG、38個のmacOS actionをまとめて動かすmacOS向けVoice AIの試みだ。
Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。
ClaudeはClaude CodeにCode Reviewを追加し、各pull requestに複数agentを並列投入する仕組みを導入したと発表した。機能はTeamとEnterprise向けresearch previewとして提供される。
LocalLLaMA投稿は、Hugging Face上の新しい人間コードレビューデータセットを紹介した。inline reviewer comment、変更前後コード、negative exampleを37言語で束ねた構成が特徴だ。
r/artificialの投稿は、OpenClawの事例がすでにOWASP Agentic Top 10のうち8分類を現実に踏んだと主張する3月2日のケーススタディを再注目させた。供給網汚染とlocalhost WebSocket信頼が中心論点だ。
PerplexityのComputerアカウントは2026年3月9日のX投稿で、Claude Code と GitHub CLI が Perplexity Computer 内で直接動くことを示した。公開デモでは Openclaw の issue を受け取り、repo の fork、修正計画、実装、pull request 提出までを Computer 環境内で進めている。
GitHubは2026年3月9日のX投稿で multi-agent system 設計ガイドを再び前面に出した。主張は、失敗の多くは model capability ではなく structure の不足にあり、typed schema、action schema、Model Context Protocol が中核的な制御になるというものだ。
高スコアのLocalLLaMA投稿では、16GBのM1 Pro上でQwen 3.5 9Bがmemory recallと基本的なtool callingを実運用向けにこなしつつ、creative reasoningでは依然としてfrontier modelに及ばなかったと報告された。