본문 바로가기
IT

NVIDIA Blackwell GPU 아키텍처 공개

by 지후니니 2024. 3. 19.
728x90
반응형

NVIDIA는 Hopper H100 GPU에 비해 최대 5배 향상된 성능을 제공하는 차세대 Blackwell GPU 아키텍처를 공개했습니다.

 

NVIDIA Blackwell GPU 

NVIDIA는 코드명 Blackwell이라는 차세대 AI 및 Tensor Core GPU 아키텍처에 대한 전체 세부 정보를 공식 발표했습니다. 예상대로 Blackwell GPU는 동일한 다이에 2개의 GPU를 통합하는 NVIDIA 최초의 MCM 디자인을 선보인 제품입니다. 

 

세계에서 가장 강력한 칩

2080억 개의 트랜지스터로 가득 찬 Blackwell 아키텍처 GPU는 2개의 레티클 제한 GPU 다이가 10TB/초 칩 간 링크로 단일 통합 GPU에 연결된 맞춤형 4NP TSMC 프로세스를 사용하여 제조됩니다. 

 

2세대 트랜스포머 엔진 

새로운 마이크로 텐서 스케일링 지원과 NVIDIA TensorRT LLM 및 Nemo Megatron 프레임워크에 통합된 NVIDIA의 고급 다이내믹 레인지 관리 알고리즘을 기반으로 Blackwell은 새로운 4비트 부동 소수점 AI로 컴퓨팅 및 모델 크기를 두 배로 지원합니다. 

 

5세대 NVLink 

수조 매개변수 및 전문가 혼합 AI 모델의 성능을 가속화하기 위해 NVIDIA NVLink의 최신 버전은 GPU당 1.8TB/s의 획기적인 양방향 처리량을 제공하여 최대 576개의 GPU간의 원활한 고속 통신을 보장합니다. 

 

RAS엔진 

Blackwell기반 GPU에는 안정성, 가용성 및 서비스 가능성을 위한 전용 엔진이 포함되어 있습니다. 또한 Blackwell 아키텍처는 AI기반 예방 유지관리를 활용하여 진단을 실행하고 신뢰성 문제를 예측하는 기능을 칩 수준에 추가합니다. 이를 통해 시스템 가동 시간을 극대화하고 대규모 AI  배포의 복원력을 향상해 한 번에 몇 주 또는 몇 달 동안 중단 없이 실행하고 운영 비용을 절감할 수 있습니다. 

 

보안 AI

고급 기밀 컴퓨팅 기능은 의료 및 금융 서비스와 같이 개인 정보 보호에 민감한 산업에 중요한 새로운 기본 인터페이스 암호화 프로토콜을 지원하여 성능 저하 없이 AI 모델과 고객 데이터를 보호합니다. 

 

압축 해제 엔진

전용 압축 해제 엔진은 최신 형식을 지원하여 데이터베이스 쿼리를 가속화하여 데이터 분석 및 데이터 과학에서 최고의 성능을 제공합니다. 앞으로 몇 년 동안 기업이 매년 수백억 달러를 지출하는 데이터 처리는 점점 더 GPU 가족화될 것입니다. 

 

 

세부사항을 살펴보면 NVIDIA Blackwell GPU는 TSMC 4NP 프로세스 노드에서 제작된 각 컴퓨팅 다이에 총 1040억 개의 트랜지스터를 갖추고 있습니다. 흥미롭게도 Synopsys와 TSMC는 모두 Blackwell GPU 생산에 NVIDIA의 Culitho 기술을 활용하여 각 칩이 차세대 AI 가속기 칩의 제조를 가속화하도록 했습니다. B100 GPU에는 초고속 칩 간 상호 연결이 가능한 10TB/s 고대역폭 인터페이스가 장착되어 있습니다. 이 GPU는 동일한 패키지에 하나의 칩으로 통합되어 최대 2080억 개의 트랜지스터와 완전한 캐시 일관성을 제공합니다. 

 

 

Hopper에 비해 NVIDIA Blackwell GPU는 1280억 개 더 많은 트랜지스터, 칩당 20페타플롭스로 향상된 AI 성능 5개, 온다이 메모리 4배를 제공합니다. GPU 자체는 세계에서 가장 빠른 메모리 솔루션을 갖춘 8개의 HBM3e 스택과 결합되어 8192비트 버스 인터페이스와 최대 192GB HBM3e메모리에서 8TB/s의 메모리 대역폭을 제공합니다. 

 

NVIDIA는 Blackwell GPU를 완전한 플랫폼으로 제공할 예정이며, 이 GPU 중 4개의 컴퓨팅 다이와 단일 Grace CPU를 결합합니다. GPU는 900GB/s NVLINK 프로토콜을 사용하여 Grace CPU와 서로 상호 연결됩니다. 

 

 

 NVIDIA Blackwell B200 GPU - 192GB HBM3e

먼저 NVIDIA Blackwell B200 GPU가 있습니다. 이는 SXM 모듈, PCle AIC 및 Superchip 플랫폼에 이르는 다양한 설계에 채택될 두 개의 Blackwell 칩 중 첫 번째입니다. B200 GPU는 TSMC 4nm 프로세스 노드를 기반으로 하는 2개의 컴퓨팅 다이를 특징으로 하는 칩렛 디자인을 활용하는 최초의 NVIDIA GPU가 될 것입니다. 

 

MCM 또는 멀티 칩 모듈은 NVIDIA 측면에서 오랫동안 등장해 왔으며 회사가 수율 및 비용과 같은 차세대 프로세스 노드와 관련된 문제를 해결하려고 시도함에 따라 마침내 여기에 왔습니다. Chiplet은 NVIDIA가 공급이나 비용을 타협하지 않고도 더 빠른 Gen over Gen 성능을 달성할 수 있는 실행 가능한 대안을 제공하며 이는 Chiplet 여정의 디딤돌일 뿐입니다. 

 

 

NVIDIA Blackwell B200 GPU는 괴물 칩이 될 것입니다. 20,480개 코어에 총 160개의 SM이 통합되어 있습니다. GPU는 최신 NVLINK 상호 연결 기술을 탑재하여 동일한 8 GPU 아키텍처와 400GbE 네트워킹 스위치를 지원합니다. 또한 H100 및 H200 칩과 동일하지만 700W 피크 TDP로 인해 전력 소모가 매우 심할 것입니다. 

 

728x90

'IT' 카테고리의 다른 글

OpenAI 차세대 모델인 GPT-5 곧 출시  (2) 2024.03.21
Intel Core i9-14900KS 리뷰  (0) 2024.03.20
Crucial T705 Gen5 M.2 PCIe NVMe SSD 발표  (0) 2024.03.18
Sony a7R V vs Leica SL3 비교  (0) 2024.03.16
iPad Air 6 사양 가격 루머  (4) 2024.03.14