NVIDIA Ra Mắt GB200 NVL4: Server AI Tiêu Thụ 5400 W Điện

NVIDIA Ra Mắt GB200 NVL4: Server AI Tiêu Thụ 5400 W Điện

NVIDIA đã chính thức giới thiệu mẫu máy chủ AI GB200 NVL4, với công suất tiêu thụ điện cao ngất ngưởng lên đến 5400 W. Đây là con số gấp đôi so với thế hệ trước, GB200 NVL2, và đang gây ra nhiều lo ngại về hiệu suất tản nhiệt của sản phẩm này.

GB200 NVL4 tại SC24

Tăng trưởng tiêu thụ năng lượng trên GB200 NVL4 khiến các doanh nghiệp muốn khai thác sản phẩm này phải đầu tư đáng kể vào hệ thống làm mát và cung cấp điện. Mặc dù cấu hình của GB200 NVL4 vẫn giữ nguyên như phiên bản cũ với 72 GPU và 36 CPU, nhưng thực tế là dòng sản phẩm NVL72 hiện tại đang gặp phải vấn đề quá nhiệt, điều này dấy lên lo ngại rằng tình trạng tương tự có thể xảy ra với GB200 NVL4.

Vấn Đề Nhiệt Độ Của GPU Blackwell

Theo một bài viết từ tạp chí The Information, nhiều đại diện từ các nhà sản xuất máy chủ và khách hàng của NVIDIA đã chia sẻ những lo lắng xung quanh việc thiết kế của GPU Blackwell, dẫn đến việc máy chủ vận hành AI thường xuyên bị quá nhiệt. Điều này tạo ra áp lực lớn lên các công ty khi họ phải tìm cách cải thiện hiệu suất làm mát để phù hợp với nhu cầu sử dụng ngày càng tăng.

Thiết kế server NVL72

Thông Số Kỹ Thuật Ấn Tượng

GB200 NVL4 được trang bị 768 GB chip nhớ HBM3E cho bốn GPU cùng với 960 GB chip nhớ LPDDR5X cho hai CPU. “Siêu chip” này còn tích hợp liên kết NVLink, cho phép giao tiếp nhanh giữa các chip. NVIDIA tự hào cho biết, GB200 NVL4 có khả năng mô phỏng gấp 2.2 lần và hiệu suất training và inference cao hơn 1.8 lần so với thế hệ trước là Grace Hopper Superchip. Dự kiến, sản phẩm này sẽ được phát hành rộng rãi vào cuối năm nay thông qua các đối tác OEM như MSI, ASUS, GIGABYTE, Wistron, Pegatron, ASRock Rack, Lenovo và HPE.

Thông số kỹ thuật GB200 NVL4

Giải Pháp Nhiệt Độ Thấp Hơn Với H200 NVL

Trong bối cảnh ra mắt GB200 NVL4, NVIDIA cũng giới thiệu sản phẩm “H200 NVL”, mà theo nhiều người đánh giá là giải pháp “mát mẻ”. Thiết bị này gồm bốn GPU H200, mỗi card PCIe có TDP tối đa là 600 W. So với phiên bản SXM có TDP lên tới 700 W, mặc dù sức mạnh của H200 NVL thấp hơn, nhưng lại mang đến lợi thế lớn về khả năng làm mát. Điều này rất quan trọng vì không phải tất cả các công ty hoặc trung tâm dữ liệu đều có điều kiện để trang bị hệ thống tản nhiệt chất lỏng.

H200 NVL - Giải pháp tản nhiệt tốt hơn

Sự ra mắt của GB200 NVL4 mang đến tiềm năng lớn cho ứng dụng AI nhưng cũng đặt ra nhiều thách thức về tiêu thụ điện năng và tản nhiệt. Các doanh nghiệp cần xem xét kỹ lưỡng khả năng hạ nhiệt và đáp ứng được yêu cầu khắt khe về năng lượng để tận dụng hết sức mạnh của sản phẩm mới này.