Google DeepMindは2025年11月13日、仮想3D環境向けのgeneralist foundation modelとしてSIMA 2を発表した。人と一緒にプレイし推論する設計を掲げ、in-context learningによる挙動改善も報告している。
#agents
AI Mar 1, 2026 1 min read
AI Hacker News Feb 27, 2026 1 min read
Hacker Newsで注目されたFDM-1発表は、1,100万時間規模の映像データを用いたvideo-native computer action学習を提示した。IDMによる自動ラベリングと大規模forking VM評価基盤が技術的な中核とされる。
LLM Feb 26, 2026 1 min read
Googleは2026-02-25、Gemini appでmulti-step taskを処理するAndroid向け機能を発表した。対象はPixel 10系とSamsung Galaxy S26 seriesで、初期展開はU.S.とKorea。
AI sources.twitter Feb 22, 2026 1 min read
アンドレイ・カルパシーが1時間でカスタムヘルストラッキングアプリをバイブコーディングした経験を共有し、従来のアプリストアモデルの時代遅れを論じた。LLMエージェントがユーザーごとのアプリをその場で生成できる未来を予言している。
LLM Reddit Feb 16, 2026 1 min read
r/LocalLLaMAの高反応投稿は、MiniMax-M2.5のHugging Face公開を契機に、量子化・推論基盤・コスト効率といった実装論点へ議論が集中していることを示した。
Sciences Hacker News Feb 16, 2026 1 min read
Hacker Newsで話題になったarXiv 2602.10177は、Aletheiaという数理研究エージェントを提示する。著者はIMO水準からPhD水準、公開未解決問題の半自律評価までを報告している。
LLM Reddit Feb 12, 2026 1 min read
Z.aiがGLM-5を公開した。744Bパラメータ(40B活性)に拡張され、28.5Tトークンで事前学習されたこのモデルは、複雑なシステムエンジニアリングと長期エージェントタスクを目標としている。