#arxiv

RSSフィード

Sciences Reddit Jun 10, 2026 1 min read

arXivの1年ban警告、AI利用より「検証しない提出」を問題視

r/artificialで議論になったのは、AIツールの禁止ではなく、未確認の生成物を学術記録に載せる責任だった。

#arxiv #ai-generated #research-integrity

LLM Hacker News May 16, 2026 1 min read

Δ-Mem：8×8の小型オンラインメモリでLLMの長期記憶課題を解決

新しいarXiv論文Δ-Memが、デルタ規則学習で更新される固定サイズの状態行列により、凍結されたLLMに長期記憶を付与する手法を提案した。MemoryAgentBenchで基準比1.31倍の性能向上を達成している。

#memory #attention #llm

AI Reddit May 16, 2026 1 min read

arXiv、LLM生成エラーを未確認のまま掲載した論文に1年間投稿禁止を実施

arXivが、LLMによるハルシネーションや誤結果を検証せずに掲載した論文の著者全員に対し、最長1年間の投稿禁止処分を開始した。AI生成コンテンツに対する学術的責任の基準を明確化する重要な方針転換だ。

#arxiv #llm #academic-integrity

Sciences Hacker News Apr 26, 2026 1 min read

Deep Learningに理論は作れるのか　HNが長く議論した理由

Hacker Newsがこの論文に反応した理由は、新しいbenchmarkでも新モデルでもなく、deep learningはいよいよ科学理論の対象になり得るという大きな主張だった。期待と懐疑が同時に走り、議論が長く続いた。

#deep-learning #theory #learning-mechanics

LLM Apr 17, 2026 1 min read

LLM judge、文書の33-67%で一貫性の崩れを隠した

新しいarXiv論文は、低い平均違反率の裏でLLM judgeの入力別不安定性が見えにくくなる問題を示した。SummEvalでは文書の33-67%に少なくとも1つのdirected 3-cycleがあり、prediction set widthはabsolute errorと強く結びついた。

#llm #evaluation #benchmarks

LLM Hacker News Apr 8, 2026 1 min read

MegaTrain、単一GPUで100B+パラメータLLMのfull precision学習を狙うHN注目論文

MegaTrainはparametersとoptimizer statesをhost memoryに置き、layerをGPUへstreamすることで、100B+ parameter LLMのfull precision学習を単一GPUで行うことを目指す。Hacker Newsで注目された理由は、問題をGPU台数ではなくmemory system設計として捉え直している点にある。

#llm-training #systems #gpu

AI Hacker News Mar 18, 2026 1 min read

Hacker Newsで注目された autonomous AI learning 論文、cognitive science から設計を組み直す

Emmanuel Dupoux、Yann LeCun、Jitendra Malik の新しい arXiv paper が Hacker News で注目を集め、現在の AI がなぜ autonomous learning に届いていないのかと、observation・active behavior・meta-control を軸にした構成を示した。

#autonomous-learning #cognitive-science #ai-architecture

LLM Mar 14, 2026 1 min read

Ares論文、動的reasoning選択でLLM agentのtoken消費を最大52.7%削減

2026年3月9日にarXivへ投稿されたAres論文は、multi-step LLM agentの各ステップでreasoning effortを動的に選ぶ手法を提案した。著者らはfixed high-effort設定に比べ、reasoning token使用量を最大52.7%削減しつつ成功率低下を小さく抑えたと報告している。

#llm-agents #reasoning #efficiency

LLM Reddit Mar 13, 2026 1 min read

r/singularity、LM head が学習信号の大半を失わせるとする論文に注目

Redditのスレッドで arXiv 論文 2603.10145 が共有され、この論文は language model の output layer が単なる softmax expressivity の問題ではなく、gradient norm の 95〜99% を抑圧する optimization bottleneck だと主張している。議論は、より良い head 設計が LLM 学習効率を大きく変え得るかに集中した。

#backpropagation #lm-head #optimization

AI Reddit Feb 25, 2026 1 min read