NVIDIA H100 — вычислительный монстр с 80 миллиардами транзисторов, новыми вычислительными блоками и памятью HBM3

NVIDIA H100 — вычислительный монстр с 80 миллиардами транзисторов, новыми вычислительными блоками и памятью HBM3

Во время основной презентации-отчета GTC 2022 компания NVIDIA объявила о своем пополнении в семействе карт-ускорителей. Новый ускоритель получил обозначение NVIDIA H100, это самое мощное творение компании за всю ее историю. По словам NVIDIA, H100, использующий 80 миллиардов транзисторов (техпроцесс TSMC 4N 4 нм), может обеспечить невероятную производительность. Благодаря новому дизайну тензорных ядер четвертого поколения он может обеспечить шестикратное увеличение производительности по сравнению с тензорными ядрами A100 и двукратное улучшение MMA (Matrix Multiply Accumulate). Кроме того, новые инструкции DPX ускоряют алгоритмы динамического программирования до семи раз, по сравнению с предыдущим ускорителем A100.

Полные технические характеристики чипа GH100 выглядят так: 144 SM и 128 ядер FP32 CUDA на каждый SM, что дает 18 432 ядра CUDA в максимальной конфигурации. Графический процессор NVIDIA H100 в форм-фактора платы SXM5 имеет 132 SM, что в сумме дает 16 896 ядер CUDA, а в форм-факторе карты расширения с интерфейсом PCIe 5.0 имеет 114 SM, что в сумме составляет 14 592 ядра CUDA. 
Графический процессор окружен 80 ГБ памяти HBM3 с пропускной способностью 3 ТБ/с. Интересно, что вариант SXM5 имеет очень большой TDP – 700 Вт, а карта с интерфейсом PCIe ограничена мощностью в 350 Вт. 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *