LLM

LLM 17h ago 1 min read

MCP 2026-07-28、セッション前提を外してagent tool基盤をHTTPへ

MCP 2026-07-28 specは、protocol-level sessionを外し、stateless core、MRTR、header routing、Tier 1 SDK更新を正式に入れた。TypeScriptとPython SDKがそれぞれ累計10億downloadを超える規模で、agent tool serverの運用前提が変わる。

#mcp #agents #protocol

LLM X/Twitter 20h ago 1 min read

Claude Mythos、HAWK鍵強度半減とAES攻撃200-800倍高速化が暗号検証に残す意味

Claude Mythos PreviewはHAWK候補署名の鍵強度を実質的に半分へ落とし、7ラウンドAES攻撃を200-800倍高速化する手法を見つけた。実運用システムには直撃しないが、暗号評価にLLMが入る段階へ進んだ。

#anthropic #claude-mythos #cryptography

LLM Hacker News 1d ago 1 min read

Kimi-K3がHugging Faceに登場、焦点は3T級モデルの運用コストへ

Kimi-K3への関心は、open weightsそのものよりも3T級モデルをどう運用し、どう調整できるかに集まった。

#kimi #open-weights #huggingface

LLM X/Twitter 1d ago 1 min read

Anthropic、オープン重み禁止よりチップ規制と安全テスト体制を求める姿勢と政策論点を読む今後の焦点

Anthropicはオープン重みモデルの全面禁止と距離を置き、強力なチップ規制、大規模蒸留の取り締まり、十分に高性能な全モデルの安全テストを軸に据えた。投稿は447万表示を超えた。

#anthropic #open-weights #ai-policy

LLM X/Twitter 1d ago 1 min read

Kimi K3、2.8T重みと1M文脈でオープンモデル運用競争を押し上げる新局面の焦点と実装課題を読む

2.8T MoEと1Mトークン文脈を持つKimi K3の重み公開で、オープンモデルの評価軸が一段上がった。Moonshotは104B有効パラメータ、896エキスパート、2.5倍の効率改善も示した。

#kimi #moonshot-ai #open-weights

LLM X/Twitter 2d ago 1 min read

Nemotron 3 Ultra、RTLエージェント9領域で平均97.1%通過率という新たな圧力

半導体設計でも、オープンモデルの実用性を測る数字が具体化してきた。NVIDIAはNemotron 3 UltraがCVDPの9つのRTL領域で平均97.1%を記録したと示した。

#nvidia #nemotron #rtl

LLM X/Twitter 2d ago 1 min read

NVIDIAのNOOA、SWE-bench 82.2%とCyberGym 86.8%で示すエージェント設計軸

エージェント競争の焦点が、モデル単体から実行基盤の設計へ移りつつある。NVIDIAはNOOAでSWE-bench Verified 82.2%、CyberGym L1 86.8%を示した。

#nvidia #agents #nooa

LLM Hacker News 3d ago 1 min read

8ドルのESP32で28.9M LLM、鍵はflashに置く重み

小さなmicrocontrollerでLLMを動かす実験の焦点は、賢さではなくmemory layoutだ。25M parametersをflashに置き、tokenごとに必要な行だけ読む。

#esp32 #edge-ai #llm

LLM Hacker News 3d ago 1 min read

DebianのLLM利用投票、禁止か条件付き許容か

Debianの論点は、AI利用そのものよりも、ライセンス、品質、開示、責任を誰が引き受けるかにある。

#debian #open-source #llm-policy

LLM Hacker News 3d ago 1 min read

Open-weight AIのKubernetes的瞬間、問われるのはモデルより周辺スタック

議論の中心は、重みを公開するかどうかだけではない。runtime、serving、評価、運用、fine-tuningまで含めたエコシステム競争に移っている。

#open-weight #ai-policy #kubernetes

LLM 3d ago 1 min read

GitHub CopilotにClaude Opus 5、長時間coding agentの選択肢が拡大

Claude Opus 5がGitHub Copilotのモデル選択肢に入り、長時間のコード変更や回帰検証をGitHubの作業面から直接任せやすくなる。対象はPro+、Max、Business、Enterpriseで、VS Code、Copilot CLI、cloud agent、JetBrainsなどへ段階的に展開される。

#github-copilot #claude-opus-5 #coding-agents

LLM 4d ago 1 min read

Claude Opus 5、Fable級のcoding性能を半額圏に寄せる日常高性能モデルとroutingの狙い

高性能モデルの競争軸が、最高点だけでなく費用対効果へ移っている。Claude Opus 5はFable 5に近いcoding・知識作業性能を掲げ、API価格は入力$5/M・出力$25/M tokensに据え置かれた。

#anthropic #claude #coding-agents