데이비드 실버의 Ineffable, 11억달러로 “슈퍼러너” 연구 시동
Original: David Silver's Ineffable opens with $1.1B to build superlearners View original →
4월 27일 Ineffable Intelligence의 X 글은 길지 않지만 무게는 크다. 새 연구소를 이끄는 인물이 강화학습 계열의 상징적 연구자인 데이비드 실버이기 때문이다. 막 열린 공식 사이트도 메시지를 숨기지 않는다. 회사의 미션은 “초지능과의 첫 접촉”이며, 사람이 만든 데이터 대신 경험에서 지식과 기술을 발견하는 시스템을 “슈퍼러너”라고 부른다.
“Led by David Silver, we’re assembling the best engineers and researchers in the world to make first contact with superintelligence.”
이 계정은 오랜 제품 이력 위에 쌓인 기업 채널이 아니다. 새 연구소가 시장에 자신을 처음 소개하는 순간에 가깝다. 그래서 주변 정보가 더 중요하다. 같은 날 실린 Reuters 보도에 따르면 Ineffable은 11억달러 시드 투자와 51억달러 기업가치로 출범했다. 주도 투자자는 Sequoia와 Lightspeed였고 Nvidia, Google, 영국 공공 자금도 참여했다. 이 정도 규모면 단순 브랜딩이 아니라 대형 채용과 장기 연구 가설을 동시에 밀어붙일 수 있다.
데이비드 실버의 이력도 이 트윗을 무겁게 만든다. Reuters는 그를 전 DeepMind 연구자이자 UCL 교수로 소개했다. 사이트 문구까지 합치면 방향은 분명하다. Ineffable은 인간이 남긴 텍스트를 더 많이 먹이는 길보다, 환경 속에서 행동하며 신호를 얻는 강화학습 중심 경로를 다시 전면에 세우려 한다. 핵심은 계산량 자체가 아니라, 시스템이 스스로 경험을 만들고 거기서 지식을 추출할 수 있느냐다.
이제 봐야 할 것은 수사 다음 단계다. 첫 기술 글, 핵심 채용, 어떤 환경에서 어떤 방식으로 학습시키는지, 그리고 첫 논문이나 벤치마크가 언제 나오는지가 진짜 분기점이 된다. “슈퍼러너”가 거대한 펀딩 문구에 머물지, 새 연구 축으로 자리 잡을지는 그때 판가름 난다.
Related Articles
r/singularity에서는 Cursor가 실제 사용자 상호작용으로 Composer를 학습시키고 최대 5시간마다 새 checkpoint를 배포한다는 설명이 화제가 됐고, reward hacking을 줄이기 위한 보정 방식도 함께 논의됐다.
RAD-2는 diffusion 기반 driving planner를 generator-discriminator 구조로 다시 짰다. imitation-only training이 약한 지점에 reinforcement learning feedback을 넣었고, strong diffusion planner 대비 collision rate 56% 감소와 complex urban traffic 실주행 배치를 보고했다.
HN이 이 글에 반응한 이유는 fake stars 자체보다, AI/LLM repo 시대에 “인기”라는 신호가 얼마나 싸게 만들어질 수 있는지였기 때문이다. 댓글들은 star 수 대신 commit, issue, code, 실제 사용자 흔적을 보라고 모였다.
Comments (0)
No comments yet. Be the first to comment!