r/artificialで議論になったのは、AIツールの禁止ではなく、未確認の生成物を学術記録に載せる責任だった。
#arxiv
RSS Feed新しいarXiv論文Δ-Memが、デルタ規則学習で更新される固定サイズの状態行列により、凍結されたLLMに長期記憶を付与する手法を提案した。MemoryAgentBenchで基準比1.31倍の性能向上を達成している。
arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。
Hacker Newsがこの論文に反応した理由は、新しいbenchmarkでも新モデルでもなく、deep learningはいよいよ科学理論の対象になり得るという大きな主張だった。期待と懐疑が同時に走り、議論が長く続いた。
新しいarXiv論文は、低い平均違反率の裏でLLM judgeの入力別不安定性が見えにくくなる問題を示した。SummEvalでは文書の33-67%に少なくとも1つのdirected 3-cycleがあり、prediction set widthはabsolute errorと強く結びついた。
MegaTrainはparametersとoptimizer statesをhost memoryに置き、layerをGPUへstreamすることで、100B+ parameter LLMのfull precision学習を単一GPUで行うことを目指す。Hacker Newsで注目された理由は、問題をGPU台数ではなくmemory system設計として捉え直している点にある。
Emmanuel Dupoux、Yann LeCun、Jitendra Malik の新しい arXiv paper が Hacker News で注目を集め、現在の AI がなぜ autonomous learning に届いていないのかと、observation・active behavior・meta-control を軸にした構成を示した。
2026年3月9日にarXivへ投稿されたAres論文は、multi-step LLM agentの各ステップでreasoning effortを動的に選ぶ手法を提案した。著者らはfixed high-effort設定に比べ、reasoning token使用量を最大52.7%削減しつつ成功率低下を小さく抑えたと報告している。
Redditのスレッドで arXiv 論文 2603.10145 が共有され、この論文は language model の output layer が単なる softmax expressivity の問題ではなく、gradient norm の 95〜99% を抑圧する optimization bottleneck だと主張している。議論は、より良い head 設計が LLM 学習効率を大きく変え得るかに集中した。
r/singularityでH-Neurons論文が拡散した。要旨では、全ニューロンの0.1%未満で幻覚発生を予測でき、介入実験で因果的関与を示したと報告している。
r/singularityで拡散した投稿はarXiv 2602.15322を共有した。論文はmasked adaptive updatesとMagmaにより、1BモデルでAdam・Muon比のperplexity改善を低オーバーヘッドで得たと報告する。
Hacker Newsで話題になったarXiv 2602.10177は、Aletheiaという数理研究エージェントを提示する。著者はIMO水準からPhD水準、公開未解決問題の半自律評価までを報告している。