LLM

LLM Hacker News Mar 11, 2026 1 min read

Hacker Newsが注目したBitNet、単一CPUで100B級1-bit inferenceを狙う

Hacker NewsはMicrosoftのbitnet.cppを再浮上させ、新しい100B checkpointというよりも、1.58-bit inferenceと省電力なlocal LLM運用へ向けたinfra更新として受け止めた。

LLM X/Twitter Mar 11, 2026 1 min read

Microsoft Foundry、Fireworks AIでAzureのopen model inferenceを強化

Microsoftは、Fireworks AIがMicrosoft Foundryに加わり、Azureでhigh-performanceかつlow-latencyなopen model inferenceを提供すると発表した。day-zero access、custom model持ち込み、enterprise controlを一体で扱える点が中核だ。

#azure #microsoft-foundry #open-models

LLM Hacker News Mar 11, 2026 1 min read

Hacker NewsでApple Silicon向けオンデバイス音声AIスタックが浮上

Launch HNスレッドはRunAnywhereのMetalRTとRCLIを押し上げ、Apple Silicon上でSTT・LLM・TTSをクラウドなしでつなぐ低遅延音声AIスタックに注目を集めた。

#apple-silicon #on-device-ai #voice-ai

LLM Reddit Mar 11, 2026 1 min read

Redditが警告したShadow APIの再現性リスク

r/MachineLearningで再注目されたarXiv 2603.01919は、GPT-5やGemini-2.5へのアクセスをうたうshadow APIを監査し、大きな性能乖離、不安定なsafety挙動、頻繁なmodel identity failureを報告した。

#shadow-apis #reproducibility #api-integrity

LLM Hacker News Mar 11, 2026 1 min read

Hacker Newsが注目したApple Silicon向けRunAnywhereのローカルVoice AIスタック

Launch HNスレッドでRunAnywhereのRCLIが可視化された。Apple Silicon上でSTT、LLM、TTS、ローカルRAG、38個のmacOS actionをまとめて動かすmacOS向けVoice AIの試みだ。

#apple-silicon #local-ai #voice-ai

LLM X/Twitter Mar 10, 2026 1 min read

Google DeepMind、Gemini 3.1 Flash-Liteのpreview提供開始

Google DeepMindはGemini 3.1 Flash-LiteがGemini APIとGoogle AI Studioでpreview提供されると発表した。同社はこれを最もcost-efficientなGemini 3 modelと位置づけ、低価格・高速性能・調整可能なthinking levelsを強調している。

#google #gemini #flash-lite

LLM X/Twitter Mar 10, 2026 1 min read

Claude Code、Team/Enterprise向けのマルチエージェントCode Reviewを投入

ClaudeはClaude CodeにCode Reviewを追加し、各pull requestに複数agentを並列投入する仕組みを導入したと発表した。機能はTeamとEnterprise向けresearch previewとして提供される。

#claude #code-review #agents

LLM Reddit Mar 10, 2026 1 min read

LocalLLaMAが注目した35.6万行規模の人間コードレビューデータセット

LocalLLaMA投稿は、Hugging Face上の新しい人間コードレビューデータセットを紹介した。inline reviewer comment、変更前後コード、negative exampleを37言語で束ねた構成が特徴だ。

#code-review #datasets #github

LLM Reddit Mar 10, 2026 1 min read

Redditが注目したOpenClaw崩壊、OWASP Agentic Top 10の実地検証例に

r/artificialの投稿は、OpenClawの事例がすでにOWASP Agentic Top 10のうち8分類を現実に踏んだと主張する3月2日のケーススタディを再注目させた。供給網汚染とlocalhost WebSocket信頼が中心論点だ。

#agent-security #owasp #openclaw

LLM X/Twitter Mar 10, 2026 1 min read

Perplexity Computer、Claude Code と GitHub CLI をコーディング workflow に統合

PerplexityのComputerアカウントは2026年3月9日のX投稿で、Claude Code と GitHub CLI が Perplexity Computer 内で直接動くことを示した。公開デモでは Openclaw の issue を受け取り、repo の fork、修正計画、実装、pull request 提出までを Computer 環境内で進めている。

#perplexity #claude-code #github-cli

LLM X/Twitter Mar 10, 2026 1 min read

GitHub、信頼できる multi-agent system には schema・action・MCP が必要と提言

GitHubは2026年3月9日のX投稿で multi-agent system 設計ガイドを再び前面に出した。主張は、失敗の多くは model capability ではなく structure の不足にあり、typed schema、action schema、Model Context Protocol が中核的な制御になるというものだ。

#github #agentic-ai #mcp

LLM Reddit Mar 10, 2026 1 min read

r/LocalLLaMA、M1 ProでQwen 3.5 9Bを実際のローカルagentとして試す

高スコアのLocalLLaMA投稿では、16GBのM1 Pro上でQwen 3.5 9Bがmemory recallと基本的なtool callingを実運用向けにこなしつつ、creative reasoningでは依然としてfrontier modelに及ばなかったと報告された。

#qwen #local-llm #ollama