В минувший вторник Microsoft Azure поделилась интересным изображением в своей социальной сети X, на котором представлены серверы с GPU-ускорением на базе NVIDIA “Blackwell” GB200 — вершина технологий серверов. Microsoft является одним из крупнейших клиентов NVIDIA, и компания часто получает продукты первой очереди для интеграции в свою облачную и корпоративную инфраструктуру.
Согласно изображению, весь кластер примерно делит вычислительное пространство, отводя одну треть для вычислительных модулей, в то время как громадные две трети системы предназначены для замкнутого жидкостного охлаждения. Это выделение пространства для охлаждения подчеркивает важность эффективного управления теплом в высокопроизводительных системах.
Особенности системы
Вся система соединена с помощью Infiniband, что является стандартом для GPU-ускоренных систем благодаря более низкой задержке при передаче данных. Хотя деталей по системе не так много, видно, что интегрированное замкнутое жидкостное охлаждение позволяет использовать GPU-ресурсы в 1U форм-факторе для увеличения плотности вычислений. Поскольку данные системы будут установлены в более широкие центры обработки данных Microsoft Azure, требуется, чтобы они были просты в обслуживании и охлаждении.
Существуют ограничения по мощности и тепловыделению, которые могут обрабатывать центры обработки данных Microsoft, поэтому подобные системы часто соответствуют внутренним спецификациям, разработанным Microsoft. Конечно, имеются более плотные вычислительные системы, такие как NVIDIA NVL72, но гиперскейлеры обычно выбирают другие настройки, которые соответствуют их специфическим требованиям.
Наконец, Microsoft отметила, что ожидаются дополнительные детали на предстоящей конференции Microsoft Ignite в ноябре, где мы узнаем больше о системах на базе GB200 для AI.