NVIDIA представила свою новейшую разработку — процессор Blackwell Ultra, который, похоже, станет венцом всей линейки Blackwell перед переходом на архитектуру Rubin. Этот чип, предназначенный для AI-серверов, отличается от своих предшественников не только впечатляющей производительностью, но и уникальными инженерными решениями.
Одним из самых заметных нововведений стала поддержка интерфейса PCIe Gen 6, в то время как чипы Blackwell для обычных серверов и потребительского рынка используют PCIe Gen 5. Это решение обеспечивает беспрецедентную пропускную способность для работы с данными. Произведённый по техпроцессу TSMC 4NP, Blackwell Ultra — это настоящий гигант, вмещающий 208 миллиардов транзисторов, что в 2.6 раза больше, чем у предыдущего поколения Hopper. С такой мощностью приходит и соответствующее энергопотребление — 1400 Вт TDP, что делает обязательным использование массивных систем охлаждения.
Но главное, конечно, производительность. Blackwell Ultra обеспечивает примерно в 1.5 раза более высокую плотность вычислений NVFP4, что напрямую влияет на скорость обработки данных. Это выражается в большем количестве токенов в секунду для задач инференса и значительном увеличении пропускной способности при обучении больших моделей. Чип объединяет 160 SM (Streaming Multiprocessors) на двух кристаллах через высокоскоростное соединение NV-HBI, которое обеспечивает пропускную способность в 10 ТБ/с. На борту также 288 ГБ памяти HBM3E с пропускной способностью до 8 ТБ/с и тензорные ядра пятого поколения, оптимизированные для NVFP4.
NVIDIA позиционирует GB300 NVL72 как идеальную сборку на базе Blackwell Ultra: стойки с жидкостным охлаждением, построенные на базе Grace Blackwell Ultra Superchips, достигают производительности экзафлопсного класса в вычислениях FP4. Кроме того, они предлагают существенные улучшения в пропускной способности на мегаватт по сравнению с предыдущими платформами HGX.
Не менее важны и программные улучшения. Полная поддержка CUDA сохраняется, а такие фреймворки, как TensorRT-LLM, используют новую архитектуру для максимального повышения эффективности и снижения стоимости за токен. Встроенные функции, такие как расширенное разделение MIG, конфиденциальные вычисления TEE-I/O, аппаратное декодирование и расширенная поддержка NVLink, делают платформу идеальной для многопользовательских AI-фабрик.
Blackwell Ultra создан для центров обработки данных, где важна плотность и эффективность. Он предлагает увеличенный объем встроенной памяти, более тесную связь с хостом через PCIe Gen 6 и продуманную синергию аппаратного и программного обеспечения, ориентированную на масштабирование инференса и стабильность работы.
