Hacker Newsが見たHyperAgents、self-improving agentをinspectableなloopにする
Original: HyperAgents: Self-referential self-improving agents View original →
Hacker NewsがHyperAgents repositoryとpaperに反応した理由は、self-improving AIを抽象的な約束ではなくinspectableなcode loopとして示したからだ。論文では、task agentとmeta agentを一つのeditable programの中にまとめ、meta-level modification procedureそのものも編集可能にしている。つまりtaskを解く方法だけでなく、次の改善を生み出す仕組み自体も変更対象にする。
DGMからDGM-Hへ
著者たちはこの枠組みをDarwin Godel Machineの拡張としてDGM-Hyperagentsと呼ぶ。従来のself-improvement系は、evaluationとself-modificationがどちらもcoding taskであるときに特に強い。coding能力が上がれば、自分の改変版を作る能力も上がるからだ。HyperAgentsはこの前提をcoding以外にも広げようとする。arXivのabstractによれば、meta agentがtask-solving behaviorと将来の改善を提案するloopの両方を書き換えることで、any computable taskへの拡張を目指している。
注目すべきなのは大きな看板よりtransfer claimだ。論文はDGM-Hがdiverse domainsで時間とともに性能を改善し、self-improvementやopen-ended explorationを持たないbaselineより良いと述べる。さらにpersistent memoryやperformance trackingのようなmeta-level improvementsがrunをまたいで蓄積し、domain間でもtransferすると主張する。もしこれが成り立つなら、それは単に少し良いpromptを見つけたという話ではない。agentが次の改善の作り方そのものを学んでいることになる。
なぜHNの議論が割れたのか
HNの反応は期待と懐疑が同時に見えた。self-modification loopを明示的にして測定対象にした点を評価する声がある一方で、結局はcoding scaffoldの最適化を大きく見せているだけではないかという指摘もあった。どちらも重要な読み方だ。repository自体はかなり具体的で、generate_loop.py、meta_agent.py、task_agent.pyのように構成要素を公開し、model-generated codeを実行する安全上のリスクも明示している。
この投稿が意味を持ったのは、HyperAgentsがopen-ended autonomous improvementを証明したからではない。むしろ、その主張を再現したり反論したりできるコードと仮説をまとめて提示したからだ。agent researchを追うコミュニティにとって、improvement loopをeditable objectとして扱い、transferを測ろうとする姿勢そのものが重要なシグナルになっている。
Related Articles
Google DeepMindのシエラレオネ実験では、問題への取り組み方を尋ねるGeminiクエリが68%から90%へ増えた。8週間、12校、1,763人を対象にしたRCTで、教育AIの評価軸が行動変化へ移っている。
Perplexityは2026年3月31日、leading-edge AI systemのsecurity、trustworthiness、practical defenseを研究するSecure Intelligence Instituteを立ち上げると発表した。Instituteページは、数百万ユーザーと数千enterpriseを支える運用経験を基盤に、PurdueのNinghui Li教授が率い、BrowseSafeやNIST関連のAI agent security論文を初期成果として示している。
2026年3月19日にHacker Newsで注目を集めたagent-satは、weighted MaxSAT benchmarkを相手にAIエージェントが実験とコード改良を繰り返すopen-source projectだ。READMEによれば、2024 MaxSAT Evaluationの229インスタンス中220件を解き、5件でcompetition bestを上回り、1件はnovel solveだという。