엔비디아, GTC 2026서 Feynman AI 칩 공개 예고 — TSMC 1.6nm 공정 적용
젠슨 황 NVIDIA CEO는 2026년 3월 16~19일 산호세에서 개최되는 GTC 2026에서 "세상을 놀라게 할" 신형 칩을 공개하겠다고 예고했다. 업계 분석가들은 NVIDIA의 차세대 Feynman 아키텍처가 핵심 발표가 될 것으로 보고 있다.
트렌드포스가 2026년 2월 25일 보도한 바에 따르면, Feynman은 TSMC의 최첨단 A16(1.6nm급) 공정으로 제조되는 NVIDIA 최초의 제품이 될 전망이다. 주요 예상 사양은 다음과 같다:
- 공정: TSMC A16 (1.6nm급, Super Power Rail)
- 메모리: HBM4 / HBM4E
- 인터커넥트: 랙 간 광학 연결을 위한 실리콘 포토닉스
- I/O 다이: 인텔 14A 또는 18A 공정 + EMIB 패키징(루머)
GTC에서는 이미 3nm 공정으로 양산에 돌입한 Vera Rubin 플랫폼(R100)에 대한 업데이트도 예정돼 있다. 삼성전자는 2월 12일 첫 번째 HBM4를 출하했으며, SK하이닉스는 2026년 NVIDIA의 HBM4 총 수요의 약 3분의 2를 공급할 것으로 예상된다.
Feynman 칩 양산은 2028년에 시작될 예정이며, 고객 출하는 2029~2030년까지 이어질 것으로 보인다. GTC 2026은 즉각적인 제품 출시보다는 로드맵 공개의 성격이 강하지만, 향후 10년간 AI 가속기 시장의 경쟁 구도를 크게 좌우할 전망이다.
출처: TrendForce
Related Articles
HN이 이 RAM shortage story에 붙은 이유는 HBM 수요가 AI data center 밖의 phones, laptops, handhelds 가격까지 밀어 올린다는 불편한 연결고리였다.
Google은 8세대 TPU를 훈련용 8t와 추론용 8i로 분리했다. 8t는 pod당 연산 nearly 3x와 121 ExaFlops를, 8i는 19.2 Tb/s 인터커넥트와 최대 5x 낮은 온칩 지연을 내세우며, 에이전트 시대에 학습과 서빙의 하드웨어 요구가 완전히 갈렸음을 보여준다.
이번 소식의 핵심은 또 하나의 클라우드 제휴가 아니다. NVIDIA와 Google Cloud는 A5X Rubin 시스템이 단일 사이트 8만개, 멀티사이트 96만개 GPU까지 확장될 수 있고, 이전 세대 대비 토큰당 추론 비용과 전력당 처리량이 각각 최대 10배 개선된다고 밝혔다.
Comments (0)
No comments yet. Be the first to comment!