Panmnesia и SK Telecom разработают архитектуру ИИ-дата-центров нового поколения на базе CXL

Panmnesia и SK Telecom разработают архитектуру ИИ-дата-центров нового поколения на базе CXL

Компания Panmnesia объявила о подписании стратегического меморандума о взаимопонимании с SK Telecom — крупнейшим телеком-оператором Южной Кореи и одним из ключевых игроков на рынке ИИ-инфраструктуры. Соглашение было заключено на выставке MWC26 в Барселоне и предусматривает совместную разработку архитектуры центров обработки данных нового поколения с опорой на стандарт Compute Express Link.

На фоне стремительного роста масштабов ИИ-сервисов операторы дата-центров вынуждены наращивать парк высокопроизводительных GPU, что приводит к резкому увеличению капитальных и операционных затрат. Партнёры намерены изменить сам подход к построению инфраструктуры, сосредоточившись не на экстенсивном увеличении числа ускорителей, а на более эффективном использовании уже развернутых вычислительных ресурсов. Ключевым элементом трансформации станет переход к CXL-ориентированной архитектуре межсоединений.

Современные ИИ-дата-центры традиционно строятся по принципу фиксированной конфигурации серверов, где CPU, GPU и память жёстко объединены внутри одной системы. Такая модель затрудняет перераспределение ресурсов между узлами: неиспользуемые вычислительные мощности одного сервера не могут быть гибко задействованы другим. Особенно остро проблема проявляется при нехватке памяти, когда для её увеличения приходится устанавливать дополнительные GPU, даже если их вычислительный потенциал не востребован. Это снижает коэффициент загрузки ускорителей и повышает совокупную стоимость владения инфраструктурой.

В рамках сотрудничества компании предлагают перейти к дезагрегированной архитектуре, при которой процессоры, графические ускорители и модули памяти разделяются по типам и объединяются динамически в зависимости от конкретной нагрузки. Вместо изолированной серверной логики ресурсы будут соединяться на уровне стойки через CXL Fabric Switch, формируя единую вычислительную среду. Такой подход позволит выделять под каждую ИИ-задачу ровно тот объём ресурсов, который действительно необходим, минимизируя избыточность и повышая экономическую эффективность.

Второе направление оптимизации связано с устранением сетевых накладных расходов. В традиционных системах коллективные операции GPU при обучении и инференсе крупных моделей выполняются через универсальные сети вроде Ethernet, что требует множественных копирований данных и участия программного стека, увеличивая задержки и снижая производительность. Переход на CXL позволит исключить сетевые узлы из критического пути передачи данных и обеспечить прямое взаимодействие устройств.

Центральным компонентом новой архитектуры станет Link Controller — электронный модуль, интегрируемый в CPU, GPU, ИИ-ускорители и память. Он обеспечивает прямую коммуникацию по CXL внутри каждого устройства, заменяя сложные схемы обмена данными операциями прямого доступа к памяти. Архитектура также предусматривает прямое взаимодействие GPU-GPU и GPU-память без участия программного обеспечения, что должно существенно повысить эффективность вычислений и обеспечить прирост производительности без увеличения числа ускорителей.

По условиям соглашения SK Telecom возьмёт на себя разработку архитектуры с учётом требований реальной эксплуатации, используя опыт строительства и управления крупными ИИ-дата-центрами, а также компетенции в области разработки и коммерциализации моделей искусственного интеллекта. Panmnesia, в свою очередь, реализует CXL-базированную стойку для ИИ-нагрузок, предоставив коммутаторы Fabric Switch и контроллеры Link Controller, расширяя межсоединительную архитектуру за пределы отдельного сервера до уровня стойки и выше.

До конца года партнёры планируют протестировать архитектуру на реальных ИИ-моделях, оценив загрузку GPU и памяти, задержки и пропускную способность. После этапа валидации намечены пилотные внедрения в крупных дата-центрах и последующая коммерциализация решения. Panmnesia уже предлагает партнёрам образцы CXL Fabric Switch с поддержкой PCIe 6.4/CXL 3.2 и контроллеры Link Controller в виде IP-блоков или кастомных кремниевых решений, параллельно проводя длительные испытания в реальных вычислительных средах для подтверждения стабильности и совместимости.

Если проект будет реализован в заявленном виде, он может задать новый вектор развития ИИ-инфраструктуры, сместив акцент с наращивания числа GPU на системную оптимизацию архитектуры межсоединений и гибкое управление ресурсами на уровне всего дата-центра.