r/MachineLearningで議論になった1.088Bパラメータのpure SNN language model
Original: I scaled a pure Spiking Neural Network (SNN) to 1.088B parameters from scratch. Ran out of budget, but here is what I found [R] View original →
このpostが主張していたこと
r/MachineLearningの研究色が強いthreadは、pure spiking neural network language modelがANN-to-SNN conversionやdistillationに頼らず、random initializationから1.088Bパラメータまで到達したという主張で注目を集めた。投稿者は18歳のindependent developerだと名乗り、training budgetが尽きたため27k stepで停止したが、それでもlossは4.4まで収束したと述べている。もちろんこれはstate-of-the-artなlanguage qualityを意味しないが、大規模SNNのdirect trainingは非常に難しくても不可能とは限らない、という点で意味がある。
postが強調した観察は3つある。第一に、modelは約93%のsparsityを維持し、tokenごとに発火するneuronはおよそ7%だったという。第二に、dataset mixで特別に狙っていなかったにもかかわらず、step 25k前後で構造的に正しいRussian textが出始めたとされる。第三に、architectureが600Mを超えて1B帯に入ると、activation routingの約39%がpersistent memory moduleへ移動した。投稿者はこれを、scaleが大きくなるほどmodel自身がmemoryの価値を学習した結果だと解釈している。
なぜ研究者が面白がったのか
もしこの挙動がより厳密な評価でも保たれるなら、重要な理由は2つある。第一は効率だ。sparse firingは、SNNがneuromorphic systemやmemory-sensitive inferenceで今なお魅力を持つ主な理由の一つである。第二は方法論だ。従来の大規模SNN結果の多くは、direct trainingが不安定なためconversionやdistillationに依存してきた。そうした状況で、1.088Bパラメータがrandom initから収束したという主張は、runが未完でも自然に注目を集める。
さらに投稿者は限界もかなり明示していた。生成品質はまだ“janky”で、GPT-2 fluencyには遠いと述べている。この自己限定があったため、thread全体もhypeよりsystems research寄りの空気を保っていた。
コミュニティが押し返した点
コメントはすぐに興奮からmeasurementへ移った。最も強い要望の一つは、報告されたlossをbits-per-byteのようなcross-model comparable metricへ変換してほしいというものだった。ほかには、このarchitectureがLoihiのようなneuromorphic hardwareへどう載るのか、先行する小規模SNN-LLM研究との違いは何か、そしてsparsityの利点が実運用costまで含めても残るのかという問いが並んだ。このthreadが示したのは明快だ。非定型なtraining結果は注目されるが、次に必要なのは、より良いbaseline、再現可能なcheckpoint、そして一本の有望なloss curve以上に明確なevaluationである。
Related Articles
r/MachineLearningではこの投稿を、完成済みのbreakthroughというより、大規模spike-domain trainingに関する現在の前提へ正面から投げ込まれた実験ログとして受け止めた。2026年4月13日の投稿は1.088B pure SNN language modelが27K stepsでloss 4.4、93% sparsityに達したと報告し、コメントでは期待と慎重論が同時に出ていた。
元DeepMind主任研究員でAlphaGoの共同開発者であるデイビッド・シルバーが、人間データを使わず強化学習のみで知識を習得するAIを開発するIneffable Intelligenceを設立。510億ドル評価額の下、、11億ドルを調達した。
フィールズ賞受賞数学者のTimothy Gowersが、ChatGPT 5.5 Proで未解決の数学問題に挑戦し、約1時間で博士レベルの証明を生成させた。現在のAI進歩速度では数学研究が近く危機を迎えると警告している。
Comments (0)
No comments yet. Be the first to comment!