Anthropicは3月18日にXで、約8万1千人の Claude ユーザーが参加した1週間の qualitative interview study を公開した。実利用者が AI に何を望み、何を恐れているかを示す大規模な一次資料だ。
#research
RSS FeedGoogleは2026年2月12日、Gemini 3 Deep Thinkの大規模アップグレードを発表した。Google AI Ultra加入者はGemini appで利用でき、researchers・engineers・enterprisesはGemini API early accessを申請できる。
2026年3月20日のHacker NewsではAttention Residualsが議論され、固定residual additionの代わりにlearned depth-wise attentionを使う発想と、低いoverheadでの実装可能性が注目された。
2026年3月17日にr/MachineLearningへ投稿されたClip to Grokスレッドは、クロール時点で56ポイントと20件のコメントを集めた。投稿者は、optimizer stepごとにdecoder weight rowをL2 clippingすることで、modular arithmetic benchmarkで18倍から66倍速いgeneralizationを得たと主張している。
OpenAIはXで、16 MBのartifact limitと8×H100で10分のtraining budgetの下で最も効率的なpretrained modelを競う公開研究チャレンジ「Parameter Golf」を開始すると発表した。固定FineWeb dataset、公開baseline repo、任意のRunpod compute creditsが用意される。
184-point の r/MachineLearning スレッドでは、ICML の no-LLM review policy 違反に対する reported enforcement をめぐり、canary ベースの検出と coauthor risk が主な論点になった。
GoogleはMar 19, 2026、contrail avoidance forecastをAmerican Airlinesの既存flight-planning softwareに統合した結果を公開した。standard scheduleに含まれる2,400便のtransatlantic flightのうち、avoidance planを実行した便ではcontrail formation rateがcontrol group比で62%低下したという。
Google DeepMindは2026年3月17日、AGIへの進捗を評価するための新しいcognitive scienceベースのframeworkを公開し、それを実用benchmarkへ落とし込むためのKaggle hackathonを開始した。10のcognitive abilityを定義し、human baselineとの比較を推奨し、community-built evaluationに総額20万ドルの賞金を設定している。
2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。
Kimi TeamのAttnRes論文は、PreNorm residualが過去のlayer出力を固定重みで足し続けることで、深いstackで情報を薄めると主張する。解決策として、layer間のselective aggregationとコストを抑えるBlock AttnResが提示されている。
r/MachineLearningのあるreviewerは、no-LLM規定のあるICML投稿が実質的に全面AI執筆に見えると述べ、policy enforcementとreview burdenをめぐる率直な議論が起きた。
r/MachineLearningで共有された新しいarXiv論文は、非公式のmodel access providerが研究結果と運用上の信頼性の両方を揺るがすと指摘している。