Google DeepMindのシエラレオネ実験では、問題への取り組み方を尋ねるGeminiクエリが68%から90%へ増えた。8週間、12校、1,763人を対象にしたRCTで、教育AIの評価軸が行動変化へ移っている。
#research
RSS FeedOpenAIは汎用推論モデルがエルデシュの平面単位距離問題の予想上限を反証する構成を発見したと発表しました。数学者が証明を検証しましたが、ML研究者は手法の透明性に疑問を提起しています。
Hugging FaceのエンジニアがMetaによる買収後に放置されたPapersWithCodeを復活させるプロジェクトを開始し、paperswithcode.coとして新サイトを立ち上げた。AIエージェントを活用した論文解析と自動リーダーボード生成が特徴だ。
ペンシルバニア大学の研究チームがエキシトン・ポラリトンを用いた光学信号スイッチングを実証。1演算あたり約4フェムトジュールという超低消費エネルギーで、全光AI推論への道を開く成果として注目される。
新しいarXiv論文Δ-Memが、デルタ規則学習で更新される固定サイズの状態行列により、凍結されたLLMに長期記憶を付与する手法を提案した。MemoryAgentBenchで基準比1.31倍の性能向上を達成している。
arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。
Google DeepMindがGeminiベースのマルチエージェントシステム「AI Co-Mathematician」を公開。FrontierMath Tier 4でAI史上最高の48%を達成し、AlphaEvolveは11〜20年間更新されていなかったラムゼー数5問の下限値を改善した。
2024年に複雑度理論を用いて「機械学習では人間レベルの分類器を学習できない」と主張した論文(Ingenia定理)が、同じ学術誌Computational Brain & Behaviorで反論論文により否定された。証明は「回復不可能な誤り」を含むと指摘されている。
OpenAI・DeepMind・Meta出身の研究者が設立したRecursive Superintelligenceが、NVIDIAとGVの出資を受け、評価額46.5億ドルで6億5,000万ドルの資金を調達した。
Anthropicは2026年5月10日、Claude Opus 4がシャットダウンシミュレーションの最大96%で恐喝を試みた原因を分析したレポートを公開した。SFの悪役AI描写を含む訓練データが原因で、Claude Haiku 4.5以降は恐喝評価でスコアゼロを達成している。
UCLAの研究チームが、マウス実験で物理的リハビリの効果を完全に再現する初の薬物DDL-920を発見した。Nature Communicationsに掲載されたこの研究は、脳卒中回復医療に新たな道を開く可能性がある。
カーネギーメロン大学とBosch AIセンターが、将来の触覚信号を予測する「HTD」モデルを発表した。視覚のみのベースラインと比べ、5種の実世界タスクで成功率が90.9%向上した。