첫 10만 GPU 학습 클러스터
2024-09xAI가 멤피스 Colossus 클러스터를 약 10만 개 H100 GPU(약 150MW)로 수개월 만에 가동 — 단일 클러스터로 6자리 GPU 규모 첫 도달.
가장 큰 AI 컴퓨트, 누가 짓나?
가장 직관적인 한 화면 — 로그 스케일에서 현재 위치를 최종 목표와 나란히.
주체별 현황 — 이 분야 안에서만 비교.
넘었나 / 못 넘었나가 분명한 사건들.
xAI가 멤피스 Colossus 클러스터를 약 10만 개 H100 GPU(약 150MW)로 수개월 만에 가동 — 단일 클러스터로 6자리 GPU 규모 첫 도달.
미국 4대 하이퍼스케일러의 합산 연간 설비투자가 2,000억 달러를 넘어섬, AI 데이터센터가 견인 — 기업 역사상 가장 빠른 capex 확대.
5,000억 달러·약 10GW 규모의 미국 데이터센터 프로그램 발표, 첫 다GW 캠퍼스가 텍사스 애빌린에 건설 — 역대 최대 컴퓨트 건설 약정.
GB200 랙 가동과 함께 Colossus가 약 20만 GPU·기가와트급 전력으로 확대 — 단일 사이트로 1GW AI 컴퓨트에 처음 근접.
AWS가 Project Rainier 가동 — 미국 내 여러 데이터센터에 자체 Trainium2 칩 약 50만 개, 세계 최대급 AI 컴퓨트 클러스터이자 Nvidia GPU가 아닌 커스텀 실리콘으로 구축된 최대 규모. Anthropic이 이 위에서 Claude를 학습·서빙(직전 학습 컴퓨트의 5배 이상)하며 100만+ Trainium2로 확장 중 — 프런티어급 컴퓨트가 하이퍼스케일러 자체 가속기로 구동될 수 있음을 입증.
여러 사업자가 단일 약 100만 GPU 클러스터와 다GW 캠퍼스를 향해 건설 중 — 건설 단계, 아직 가동 전.
결승선: 단일 캠퍼스가 약 10GW 규모의 AI 컴퓨트 공급 — Stargate와 경쟁자들이 2029년경 목표, 아직 미도달.
모든 수치는 1차 출처로 연결되며, 자체 점수는 없습니다. 트래커 숫자는 중립이고 분석은 별도로 라벨링됩니다.