Компания NVIDIA анонсировала NVIDIA BlueField-4 STX — модульную эталонную архитектуру для построения ускоренных систем хранения данных, ориентированных на задачи агентного искусственного интеллекта. Новая разработка призвана устранить ключевое ограничение традиционных дата-центров, где высокоемкие системы хранения не обеспечивают достаточной отзывчивости для современных AI-нагрузок с длинным контекстом.
С распространением агентных моделей, способных работать с большими объёмами данных, выполнять сложные многошаговые задачи и поддерживать длительные сессии, требования к инфраструктуре хранения резко возросли. В таких сценариях критично не только хранение информации, но и её мгновенная доступность, поскольку задержки напрямую влияют на скорость инференса и эффективность использования GPU.
Архитектура STX предлагает новый подход, при котором данные остаются максимально близко к вычислительным ресурсам, обеспечивая высокую пропускную способность и минимальные задержки. В рамках первой реализации на уровне серверной стойки используется платформа контекстной памяти NVIDIA CMX, которая фактически расширяет память графических ускорителей дополнительным высокопроизводительным слоем. По данным NVIDIA, это позволяет увеличить скорость обработки токенов до пяти раз по сравнению с традиционными системами хранения.
В основе решения лежит интеграция с платформой NVIDIA Vera Rubin, а также новый специализированный процессор BlueField-4, объединяющий CPU-архитектуру Vera с сетевым адаптером ConnectX-9 SuperNIC. Дополняют стек высокоскоростная сеть Spectrum-X Ethernet и программные решения DOCA и AI Enterprise, формируя единую инфраструктуру для AI-нагрузок.
По заявлению главы компании Jensen Huang, развитие агентного ИИ требует полного переосмысления всей цепочки обработки данных, включая хранение. Новая архитектура должна обеспечить непрерывную работу систем, способных анализировать большие контексты и обучаться в реальном времени.
Среди преимуществ STX также отмечается повышение энергоэффективности — до четырёх раз по сравнению с традиционными CPU-ориентированными системами хранения, а также удвоенная скорость обработки данных на уровне корпоративных задач. Это делает платформу особенно привлекательной для построения масштабируемых AI-инфраструктур.
К разработке и внедрению решений на базе STX уже подключились крупные игроки рынка хранения и облачных технологий, включая Dell Technologies, IBM, HPE и NetApp. Также ожидается активное использование новой архитектуры со стороны облачных провайдеров и AI-лабораторий, среди которых CoreWeave и Mistral AI.
Появление первых коммерческих решений на базе BlueField-4 STX запланировано на вторую половину текущего года. В NVIDIA рассчитывают, что новая архитектура станет фундаментом для следующего поколения AI-инфраструктуры, способной эффективно работать с задачами, требующими обработки огромных объёмов контекстных данных.
