#llm-research

LLM Reddit Mar 13, 2026 1 min read

r/MachineLearning、LLM benchmark 論文は出る頃には古くなるのかを議論

r/MachineLearningの高反応スレッドは、proprietary model が毎月変わり古い version が消える中で、benchmark 論文に何が残るのかを問うた。もっとも支持された見方は、ranking はすぐ古くなる一方で、dataset や failure case は長く使える eval asset になり得るというものだった。

#benchmarks #evaluation #llm-research

LLM Hacker News Mar 13, 2026 1 min read

Hacker News、transformer内部でprogram executionを行うという Percepta の主張に注目

Perceptaは2026年3月11日の投稿で、transformer 内部に computer を構築し、arbitrary C program を数百万 step 実行し、2D attention head で inference を指数的に高速化できると主張した。HNの読者は刺激的な研究方向として受け止めつつも、より明確な説明、benchmark、拡張性の根拠を求めた。

#transformers #inference #llm-research

LLM Reddit Mar 11, 2026 1 min read

r/MachineLearningが押し上げた2x 4090のLLM layer duplication実験

高評価のr/MachineLearning投稿はDavid Noel Ngの長いblog記事を再浮上させ、Qwen2-72Bの中間7-layer blockをweight変更なしで複製するだけでopen leaderboard上位に届いたという主張を改めて注目させた。

#llm-research #qwen #leaderboard