LLM Reddit Mar 6, 2026 1 min read Reddit議論: Attentionは本当にn^2ではなくd^2として捉えるべきか r/MachineLearningで注目された投稿は、Attentionの本質をd^2最適化幾何として説明する非公式主張を共有した。反応は関心と懐疑が並存し、査読と再現性の確認が必須だという意見が優勢だった。 #attention#transformers#ml-theory 15