LLM Reddit Apr 1, 2026 1 min read RBF-Attentionを試した実験が示す、attentionを入れ替える難しさ r/MachineLearning の投稿は、dot-product attention を距離ベースの RBF-Attention に置き換えたとき、理論よりも実装の連鎖的な破綻が大きいことを具体的に示した。 #transformers#attention#rbf 16