NVIDIA представила платформу Rubin и новый DGX SuperPOD — фундамент для следующего поколения AI-фабрик

NVIDIA представила платформу Rubin и новый DGX SuperPOD — фундамент для следующего поколения AI-фабрик

На выставке CES в Лас-Вегасе NVIDIA сделала один из самых амбициозных анонсов последних лет, представив платформу Rubin — следующий шаг в развитии инфраструктуры для искусственного интеллекта. Именно на ней будет строиться новое поколение NVIDIA DGX SuperPOD, масштабируемых суперкомпьютерных систем, рассчитанных на работу с агентными ИИ, моделями mixture-of-experts и задачами с длинным контекстом. По сути, компания закладывает основу для AI-фабрик нового типа, где обучение и инференс становятся быстрее, дешевле и технологически проще.

Платформа Rubin — это не один процессор, а сразу шесть специализированных чипов, спроектированных как единое целое. В неё входят центральный процессор NVIDIA Vera, графический ускоритель Rubin, коммутатор NVLink шестого поколения, сетевой адаптер ConnectX-9, DPU BlueField-4 и Ethernet-коммутатор Spectrum-6. Такой подход к совместному проектированию позволяет ускорить обучение моделей и значительно снизить стоимость генерации токенов при инференсе — критически важный параметр на фоне стремительного роста масштабов современных ИИ-моделей.

DGX SuperPOD остаётся базовым «чертежом» для развёртывания систем на базе Rubin в корпоративной среде и научных центрах. NVIDIA подчёркивает, что её DGX-платформа охватывает весь стек технологий — от вычислений и сетей до программного обеспечения — и поставляется как цельная система. Это снимает с заказчиков сложную задачу интеграции разрозненных компонентов и позволяет сосредоточиться на разработке и внедрении ИИ. По словам Дженсена Хуанга, спрос на вычисления для обучения и инференса растёт взрывными темпами, и Rubin выходит на рынок именно в тот момент, когда индустрии особенно нужна новая ступень эффективности.

Технологические нововведения Rubin нацелены на резкий скачок производительности и надёжности. Новое поколение NVLink обеспечивает гигантскую пропускную способность между ускорителями, процессор Vera с архитектурой Arm предлагает более эффективные вычисления для AI-фабрик, а GPU Rubin выдаёт десятки петафлопс вычислений в формате NVFP4, оптимизированном для инференса. Впервые на уровне стойки реализованы механизмы конфиденциальных вычислений, обеспечивающие защиту данных сразу на CPU, GPU и межсоединениях. Дополняет картину обновлённая система надёжности и обслуживания, которая позволяет выявлять сбои в реальном времени и значительно ускоряет сервисные операции. В совокупности эти решения, по оценке NVIDIA, дают до десятикратного снижения стоимости инференса по сравнению с предыдущим поколением.

В рамках DGX SuperPOD платформа Rubin масштабируется до уровня, где вся стойка фактически работает как единый вычислительный организм. Конфигурации с DGX Vera Rubin NVL72 объединяют сотни GPU и десятки процессоров в общее пространство памяти и вычислений, устраняя необходимость дробить модели на части. Альтернативный вариант с DGX Rubin NVL8 предлагает более компактный и универсальный вход в эпоху Rubin, сочетая жидкостное охлаждение, x86-процессоры и заметный прирост производительности относительно систем предыдущего поколения.

Отдельное внимание NVIDIA уделяет сетям. Rubin превращает дата-центр в высокопроизводственную AI-фабрику с новым уровнем пропускной способности и предсказуемости. Использование InfiniBand и Ethernet нового поколения, ускорителей BlueField-4 и адаптеров ConnectX-9 позволяет избежать типичных проблем масштабирования, таких как перегрузки и нестабильные задержки. Такая архитектура рассчитана на кластеры, потребляющие мегаватты энергии, и должна оставаться эффективной по мере усложнения моделей и роста трафика.

Неотъемлемой частью экосистемы становится программное обеспечение. NVIDIA Mission Control, система автоматизированного управления AI-инфраструктурой, будет доступна и для Rubin-систем, позволяя компаниям контролировать питание, охлаждение, загрузку кластеров и восстановление после сбоев. Поддержка платформы NVIDIA AI Enterprise и микросервисов NIM дополняет аппаратную мощь готовыми инструментами для развёртывания и эксплуатации ИИ.

Выход платформы Rubin и обновлённого DGX SuperPOD NVIDIA называет отправной точкой для новой волны индустриального ИИ. Речь идёт о системах, способных рассуждать на тысячах шагов, работать с мультимодальными данными и делать это при существенно более низкой стоимости. Поставки DGX SuperPOD на базе Rubin запланированы на вторую половину года, и именно с них, по замыслу компании, начнётся следующий этап эволюции AI-фабрик.