HNでの関心は、モデル名そのものより、同価格での改善、安くなったfast mode、Claude Codeのdynamic workflowsが実作業で効くかに集まった。
#agentic-ai
RSS FeedAlibabaのQwenチームがエージェント重視のフロンティアモデルQwen3.7-Maxを公開した。Artificial Analysis評価でGPT 5.4に迫る5位を記録し、オープンウェイトフロンティアモデルの新基準を示している。
オープンソースPythonフレームワークForgeが、構造化ガードレールを適用することでMinistral-3 8BモデルのエージェントタスクにおけるACCを53%から99%に向上させた。ACM CAIS '26で発表された研究成果だ。
GoogleがエージェントワークフローとマルチステップタスクのためにGemini 3.5 Flashをリリースした。競合フロンティアモデル比4倍の出力速度とコスト半減を実現し、コーディング・推論・マルチモーダルの各ベンチマークでトップ水準を記録している。
ゴールドマン・サックス・オルタナティブスの報告書は、エージェントAIシステムが通常のチャットモデルより最大130倍のエネルギーを消費すると警告。米国は2028年までに45GWの電力不足と技術労働者60万人の欠員に直面すると試算している。
Cloudflareが2026年Q1決算で過去3ヶ月のAI利用量が600%増加したと発表。同時にエージェント型AI再編の一環として全従業員の20%にあたる1,100人の解雇を発表した。
マルチモーダルエージェントは、視覚・音声・テキストを別モデルでつなぐ分だけ遅く高くなりがちだ。NVIDIAはNemotron 3 Nano Omniでその構成を1本化し、30B・256K文脈、同じ応答性条件で動画推論の実効容量最大9.2倍を打ち出した。
NVIDIA AI PCは2026年4月2日のXで、Gemma 4 モデル群が RTX GPU と DGX Spark 向けに最適化され、とくに 26B と 31B が local agentic AI に適していると述べた。NVIDIA の公式 blog では、この協業が RTX PC、workstation、DGX Spark、Jetson Orin Nano、data center 配備までをカバーし、native tool use、multimodal input、Ollama と llama.cpp による local runtime を支えると説明している。
ARC PrizeによるARC-AGI 3公開直後、r/singularityはinteractive environmentとaction-efficient scoringへの転換に注目した。要点は、frontier AIが未知環境での一般化・探索・計画ではまだ大きく遅れているということだ。
Perplexityは2026年3月27日、同社APIがGalaxy AndroidとWindowsのSamsung Browser内でBrowsing Assistを支えていると発表した。Perplexityはcustom endpointとzero data retention付きsingle-tenant clusterを基盤に10億台超のSamsung deviceへ届く展開だと述べ、Samsungはページ文脈理解、history検索、tab管理、mobile-to-PC継続 browsingを行うbrowser assistantとして説明している。
Hacker Newsでは、Armの新しいAGI CPUをGPUの代替ではなく、ラックスケールのagentic AI基盤を支えるNeoverseベースの制御プレーンCPUとして捉える見方が目立った。
NVIDIAが2026年3月23日にVera CPUを公開した。agentic AIとreinforcement learning時代に向けた専用CPUと位置付け、従来rack-scale CPU比で50%高速、効率2倍だと主張している。