Новая эра вычислений: NVIDIA анонсирует Rubin CPX для искусственного интеллекта

Новая эра вычислений: NVIDIA анонсирует Rubin CPX для искусственного интеллекта

Компания NVIDIA продолжает удивлять мир стремительными темпами развития технологий для искусственного интеллекта. На саммите AI Infra Summit был представлен новый, узкоспециализированный ускоритель — Rubin CPX. Этот чип, созданный на основе грядущей архитектуры «Rubin», предназначен для решения одной из самых сложных задач: работы с гигантскими контекстными моделями, которые способны обрабатывать миллионы токенов одновременно.

В отличие от привычных двухчиповых решений, таких как Blackwell и Blackwell Ultra, Rubin CPX построен на монолитном кристалле. Такое решение может упростить производство, сохраняя при этом невероятную вычислительную плотность. Заявленная производительность чипа составляет 30 петафлопс (PetaFLOPS) в формате NVFP4, а сопровождается он 128 ГБ сверхбыстрой памяти GDDR7.

«Rubin CPX» призван решить проблему вычислительных «узких мест», которые возникают при обработке огромных объёмов данных. Представьте себе: анализ целого программного кода или обработка многочасового видео, где количество токенов может достигать миллиона. Именно для таких сценариев и создан этот ускоритель.

Помимо впечатляющей производительности, чип получил четыре видеокодера NVENC и четыре декодера NVDEC, встроенных прямо на кристалл. Это позволяет значительно ускорить рабочие процессы, связанные с мультимедиа. По данным NVIDIA, Rubin CPX в три раза быстрее обрабатывает «внимание» нейросетей по сравнению с флагманским ускорителем GB300 Blackwell Ultra.

Специализация «Rubin CPX» проявляется и в том, как он справляется с инференсом (работой) ИИ-моделей. По мере того как модели эволюционируют от простого создания текста к сложным системам, требующим рассуждений, операции делятся на две части: ресурсоёмкую обработку контекста и генерацию токенов, зависимую от пропускной способности памяти. Дизайн «CPX» оптимизирован именно для этих двух задач, что делает его идеальным для корпоративных чат-ботов, анализирующих 256 000 токенов, или для анализа кода объёмом более 100 000 строк.

NVIDIA планирует интегрировать «Rubin CPX» в гибридные платформы Vera Rubin NVL144 CPX, где он будет работать в паре с обычными ускорителями «Rubin». Такая конфигурация обеспечит общую производительность до 8 экзафлопс (ExaFLOPS) на стойку, что делает её идеальным решением для самых требовательных задач. Выход «Rubin CPX» запланирован на конец 2026 года, вслед за релизом основной линейки «Rubin» в начале того же года.