デイビッド・シルバーのIneffable、11億ドルで「スーパーラーナー」始動
Original: David Silver's Ineffable opens with $1.1B to build superlearners View original →
4月27日のIneffable IntelligenceのX投稿は短いが、含意はかなり大きい。新ラボを率いるのが、強化学習分野で最も知られた研究者の一人であるデイビッド・シルバーだからだ。公開されたばかりの公式サイトも方向性を隠していない。掲げる使命は「超知能とのファーストコンタクト」であり、人間が残したデータに頼るのではなく、経験から知識や技能を見いだすシステムを「スーパーラーナー」と呼んでいる。
“Led by David Silver, we’re assembling the best engineers and researchers in the world to make first contact with superintelligence.”
このアカウントは、長年の製品更新を積み重ねてきた企業タイムラインではない。新研究所が市場に自分を名乗った最初の大きな瞬間だ。だから周辺情報の重みが増す。同日掲載のReuters報道によれば、Ineffableは11億ドルのシード資金を調達し、評価額は51億ドル。SequoiaとLightspeedが主導し、Nvidia、Google、英国の公的資金も参加したという。この規模なら、単なる看板ではなく、大規模採用と長期研究仮説の両方を押し進められる。
シルバーの経歴もこの投稿を重くしている。Reutersは彼を元DeepMind研究者であり、ユニバーシティ・カレッジ・ロンドンの教授だと伝えている。サイトの文言まで合わせると、狙いは明確だ。Ineffableは、人間生成データを大量投入する現在の主流よりも、環境の中で行動し、そこから信号を得る強化学習中心の道を前面に戻そうとしている。問われるのは計算資源の多寡ではなく、システムが自ら経験を作り、その経験から知識を抽出できるかどうかだ。
次に見るべきは、壮大な言葉の先に何が出てくるかだ。最初の技術ブログ、主要採用、学習環境の設計、そして初の論文やベンチマーク。それらが揃って初めて「スーパーラーナー」が本当の研究計画なのか、強力な資金調達の物語なのかが見えてくる。
Related Articles
RAD-2はdiffusion-based driving plannerをgenerator-discriminator構造に組み替え、imitation-only trainingの弱点にreinforcement learning feedbackを入れた。strong diffusion planner比でcollision rate 56%低下、complex urban trafficでの実配備も報告している。
r/singularityでは、Cursorが実ユーザー相互作用でComposerを学習し最短5時間ごとにcheckpointを展開するとする説明が話題になり、reward hackingを抑える補正ロジックも重要論点として共有された。
Artemis は $70 million を携えて stealth を抜け出し、防御側に必要なのは alert の山ではなく AI-native の security brain だと賭けた。会社側はすでに several seven-figure deals を取り、2026 年末までに multi-million-dollar ARR を見込むとしている。
Comments (0)
No comments yet. Be the first to comment!