Новые чипы для ИИ Nvidia Blackwell при объединении в серверы страдают от перегрева
Поставки ускорителей для ИИ Nvidia Blackwell сталкиваются с новыми проблемами. Как сообщается, адаптеры перегреваются.
фото: WCCF TechСерверы на основе таких GPU уже поставляются, и первые клиенты столкнулись с проблемами перегрева, из-за чего они опасаются перебоев с поставками, из-за которых у них не будет достаточно времени для запуска новых центров обработки данных.
Сообщается, что графические процессоры Blackwell перегреваются при их объединении в серверные стойки, рассчитанные на установку до 72 чипов. Речь о старшей модели серверов — Blackwell NVL72. Именно на него Nvidia делает основную ставку, и именно он наиболее интересен крупным клиентам.
По словам сотрудников Nvidia, которые работали над этой проблемой, а также клиентов и поставщиков, осведомленных о ней, производитель чипов несколько раз просил своих поставщиков изменить конструкцию стоек, чтобы решить проблему перегрева. Однако это пока не помогло.
Вполне вероятно, что Nvidia снова ограничит поставки таких решений пока полностью не устранит проблему. Напомним, чипы Blackwell потребляют огромное количество энергии: до 1 кВт на один GPU.