NVIDIA ускоряет «Vera Rubin»: суперчип несколько раз дорабатывали ради конкуренции с AMD Instinct MI400

NVIDIA продолжает активно шлифовать архитектуру своего следующего флагманского решения для центров обработки данных — платформы «Vera Rubin». В преддверии первых поставок, которые ожидаются в конце лета, компания несколько раз пересматривала характеристики суперчипа VR200, стремясь укрепить позиции в прямом противостоянии с будущей линейкой ускорителей AMD Instinct MI400.

По данным SemiAnalysis, еще в марте NVIDIA ориентировалась на пропускную способность системы VR200 NVL72 на уровне 13 ТБ/с. К сентябрю этот показатель был повышен до 20,5 ТБ/с, а на выставке CES 2026 компания официально подтвердила, что финальная версия системы уже работает с пропускной способностью 22 ТБ/с. Для рынка ИИ-ускорителей это критически важный параметр, поскольку именно он определяет, насколько эффективно GPU могут обмениваться данными в составе масштабируемых кластеров.

Причина столь агрессивных улучшений вполне прозрачна. Ранее NVIDIA уступала по системной пропускной способности будущему ускорителю AMD Instinct MI455X, который рассчитан на 19,6 ТБ/с. Чтобы нивелировать это отставание, NVIDIA сделала ставку на более быструю память DRAM и доработку межсоединений между CPU, GPU и остальными компонентами системы, фактически усилив «транспортную инфраструктуру» внутри суперчипа.

Со своей стороны AMD уже в ноябре открыто сравнила линейку MI400 с грядущими решениями NVIDIA. Компания заявляет сопоставимую вычислительную производительность и пропускную способность памяти, но при этом делает акцент на полуторакратном преимуществе по объему памяти и масштабируемости. В теории MI400 смогут обеспечивать до 40 PFLOPs в формате FP4 и 20 PFLOPs в FP8, что примерно вдвое превышает показатели текущих MI350. Существенный вклад в это дает переход на память HBM4, благодаря которому емкость одного GPU вырастает с 288 до 432 ГБ, а общая пропускная способность — с 8 до 19,6 ТБ/с. Каждый ускоритель также получает до 300 ГБ/с пропускной способности для масштабирования между узлами и более широкую поддержку форматов данных для ИИ.

NVIDIA, впрочем, не остается в роли догоняющего. Для Rubin компания обозначила целевой уровень около 50 PFLOPs вычислений FP4 на один GPU, что дает порядка 100 PFLOPs FP4 на двухпроцессорный суперчип. Каждый GPU Rubin объединяет два крупных вычислительных чиплета и восемь стеков HBM4, обеспечивая примерно 288 ГБ памяти на GPU и до 576 ГБ на весь Superchip. Важно и то, что такие GPU будут поставляться исключительно в составе готовых систем, а не как отдельные ускорители.

На практике это означает, что ключевую роль в новом витке конкуренции сыграют не только «сырые» цифры производительности, но и то, насколько хорошо решения NVIDIA и AMD покажут себя в реальных сценариях обучения и инференса ИИ-моделей. Выбор, который сделают гиперскейлеры и крупные облачные провайдеры, во многом определит расстановку сил на рынке ускорителей следующего поколения.