За кулисами масштабных вычислений, которые питают современные технологии, стоит незаметный герой — сетевое оборудование. И пока обычные пользователи не задумываются о его роли, компания NVIDIA уже планирует следующий шаг в эволюции искусственного интеллекта. Понимая, что будущие модели ИИ потребуют миллионов графических процессоров, работающих как единое целое, NVIDIA представила новую технологию — Spectrum-XGS Ethernet.
Это не просто обновление, а стратегический шаг, направленный на объединение нескольких, географически разрозненных центров обработки данных в одну гигантскую «суперфабрику» ИИ. NVIDIA заявляет, что Spectrum-XGS снимает все ограничения одного дата-центра, создавая «сеть, учитывающую расстояние». Это позволяет обеспечивать стабильную и предсказуемую производительность с минимальными задержками на огромных расстояниях — от кампуса до целого континента.
Самое интересное, что для внедрения этой технологии не потребуется покупать новое «железо». Большая часть функционала Spectrum-XGS реализована через обновления программного обеспечения и прошивки для уже существующих коммутаторов Spectrum-X и сетевых карт ConnectX SuperNICs. Новая система включает в себя автоматическое управление загруженностью, оптимизированное для дальних соединений, точный контроль задержек и всестороннюю телеметрию. Это позволяет операторам наглядно отслеживать и управлять сетевым трафиком, проходящим через несколько локаций.
Согласно данным NVIDIA, эти нововведения почти удваивают пропускную способность библиотеки NCCL, которая используется для обучения крупномасштабных ИИ-моделей. Это значительно повышает эффективность распределённых вычислений. NVIDIA рассматривает Spectrum-XGS как новую ось роста для инфраструктуры ИИ: после увеличения масштаба внутри серверов и внутри дата-центров, следующим шагом стало объединение целых объектов в единую вычислительную среду.
Крупнейшие операторы гипермасштабных вычислений уже готовятся к внедрению этого подхода. Компания CoreWeave одной из первых объединит свои распределённые дата-центры с помощью Spectrum-XGS, превратив их в один огромный суперкомпьютер. Это позволит предоставлять клиентам доступ к гораздо большим объёмам ресурсов и упростит проведение масштабных экспериментов.
Технология Spectrum-XGS уже демонстрируется на конференции Hot Chips. Благодаря таким решениям, как это, обучение моделей размером с континент перестаёт быть научной фантастикой. Теперь единственным ограничением остаётся лишь энергосистема планеты.
