Skip to content
腐食中

r/MachineLearningで広がったHALO-Loss、モデルに本当の「わからない」を持たせようという提案

Original: "I don't know!": Teaching neural networks to abstain with the HALO-Loss. [R] View original →

Read in other languages: 한국어English
AI Apr 14, 2026 By Insights AI (Reddit) 1 min read 11 views Source

r/MachineLearningでこの投稿が伸びた理由は、「safety」という言葉の大きさよりも、主張の形がかなり具体的だったからだ。Cross-Entropyを置き換えるlossを使って、モデルが本当に「I don't know」と引けるようにしながら、base accuracyはほとんど落とさない。読者が反応したのはまさにそのtrade-offで、精度を大きく崩さずにcalibrationとOOD rejectionを一緒に改善できるのか、という問いだった。

投稿では HALO-Loss を、class prototypeとのEuclidean distanceを使うdrop-in replacementとして説明している。従来の unconstrained dot product ではなく、latent spaceの原点に zero-parameter の abstain class を置けるようにして、意味のない入力を無理に既存クラスへ押し込まない構造にする、という発想だ。数字もはっきり出していて、そこが議論を呼んだ。

  • CIFAR-10 base accuracy: +0.23%
  • CIFAR-100 base accuracy: -0.14%
  • ECE: およそ8%から1.5%へ低下
  • SVHN FPR@95: 22.08%から10.27%へ低下

コメント欄の空気も面白い。上位コメントは持ち上げ一色ではなく、すぐに benchmark の厳しさへ向かった。CIFAR-10/100だけでは弱いのでより現実的なデータセットも見たい、という声があり、別のコメントは prototype-based や contrastive 系との重なりを指摘しながら、本当の新規性は regularization にあるのではと問い返している。これは否定ではなく、コミュニティが十分に真面目に受け止めている証拠だ。

もしHALO-Lossが小さなvision benchmarkの外でも効くなら、使い道はかなり見えやすい。安全性が重要なclassification、OOD detection、そしてmultimodalで不整合な組み合わせを拒否したいケースなどだ。投稿者は 技術ブログコード も公開していて、話題だけで終わらない形にしている。元の議論は r/MachineLearning にある。このスレッドの熱量は大げさな礼賛ではなく、「abstentionをloss設計の中にどう埋め込むのか」というかなり技術的な興味に支えられている。

Share: Long

Related Articles

AI Reddit May 14, 2026 1 min read

2024年に複雑度理論を用いて「機械学習では人間レベルの分類器を学習できない」と主張した論文(Ingenia定理)が、同じ学術誌Computational Brain & Behaviorで反論論文により否定された。証明は「回復不可能な誤り」を含むと指摘されている。