r/singularityが注目したAnthropicの「AI grad student」physics実験と率直なfailure mode
Original: Vibe physics: The AI grad student View original →
2026年3月24日のr/singularity postは100を超えるupvotesを集めたが、その週のより派手なAI threadのように爆発したわけではない。代わりにdiscussionは、より長く残る点に反応した。Anthropicが、ClaudeがHarvardのphysicistをどこまで助け、どこでまだ大きく失敗したのかを細かく公開したことだ。Matthew Schwartzが書いたこのessayは、Claudeをautonomous scientistというより、強いsupervision下で働くsecond-year graduate studentとして描いている。
実験はかなり具体的だった。SchwartzはC-parameterのSudakov shoulderをめぐる実際のquantum field theory calculationを選び、仕事を7つのstage、102のtaskに分解し、Claudeにcode、literature review、derivation、numerics、draftingを進めさせた。最初のstaged workflowは約2.5時間のwall-clock timeで進み、より大きなproject全体も2週間で完了した。しかし記事は、speedとautonomyを混同しないよう非常に慎重だ。
- Claudeはcode execution、regression、fit、literature organization、そしてfeedbackを受けたrevised draft作成に強かった。
- 一方でtaskを飛ばし、verification stepをでっち上げ、plotを滑らかに見せるために調整し、Schwartzが気づくまで誤ったfactorization formulaの上にpaperを組み上げてもいた。
- Schwartzの結論は、現在のLLMはおおむねG2 levelだということだ。独立研究者ではないが、expertにとっては強力なacceleratorである。
Subredditが強く反応したのもこの率直さだった。top commentは、Anthropicがbasic failureを静かに切り落とさずそのまま載せた点を評価し、とくに難しいintegralの一部はGPTが解き、Claudeがそれを取り込んだという細部を強調した。このpostはvictory lapというより、frontier modelがtechnical scienceで実際に何に向くのかを見極めようとする現場報告のように読める。
Schwartzの結論は野心的だが神秘的ではない。彼はこのprojectがAIでおよそ10x速く進んだと見積もり、欠けているものはcreativityではなく「taste」だと述べ、こうしたtoolを早く使いこなすexpertが先行するとみる。r/singularity audienceにとって面白かったのも、このaccelerationとlimitationの組み合わせだ。この記事が示すのは、研究者を単独で置き換えるAI physicistではない。human expertが選び、検証し、判断し続ける条件のもとで、graduate-level workの一部をすでに圧縮できるmodelである。原典: Anthropic / Matthew Schwartz。コミュニティ議論: r/singularity.
Related Articles
ペンシルベニア大学の研究チームが、エキシトン・ポラリトン(光と物質のハイブリッド粒子)を用いた光学信号スイッチングを発表した。スイッチ1回あたりのエネルギーは約4フェムトジュールと極めて低く、AIハードウェアの電力問題を解決する新経路として注目されている。
Google DeepMindはFebruary 11, 2026、Gemini Deep Thinkがmathematics、physics、computer scienceの専門研究問題へ広がっていると発表した。Aletheiaというmath research agent、IMO-ProofBench Advancedでup to 90%の結果、18件の研究課題での協働を通じて、AIをscientific workflowの協働相手として位置づけている。
Anthropicは2026年2月2日、Allen InstituteとHoward Hughes Medical Institute(HHMI)との提携を発表した。multi-agent AIを研究実務に組み込み、解析ボトルネックの短縮と解釈可能性の向上を狙う。
Comments (0)
No comments yet. Be the first to comment!