Перейти к содержимому
pcreview.kz

pcreview.kz

Интересные обзоры и тесты видеокарт, процессоров, ноутбуков и комплектующих. Бенчмарки, сравнения, советы по выбору ПК в Казахстане.

cropped-zenbook-duo_ux8407aa_js_1205x130_podrobnee.jpg
Основное меню
  • НОВОСТИ
    • Новости Software
    • Новости Hardware
  • ОБЗОРЫ
    • Ноутбуки
    • Процессоры
    • Материнские платы
    • Видеокарты
    • Водяное охлаждение
    • Оперативная память
    • Накопители
    • Блоки питания
    • Корпуса
    • Звуковые карты
    • Кулера
    • Периферия
    • Сетевые устройства
  • ЭКСПЕРИМЕНТЫ
  • РЕДАКЦИЯ
  • Переключатель языка
Кнопка: светлая/темная
Подписка
  • Главная
  • Новости
  • Penguin Solutions представила сервер MemoryAI с CXL-памятью для преодоления «memory wall» в AI-инференсе
  • Новости
  • Новости Hardware
  • Новости Software

Penguin Solutions представила сервер MemoryAI с CXL-памятью для преодоления «memory wall» в AI-инференсе

Александр Перевозчиков 18.03.2026 (Последнее обновление: 18.03.2026) 1 минуты чтение
Nnb3vncnxec8BSrf

Компания Penguin Solutions объявила о выпуске первого в отрасли готового к промышленному применению сервера KV-кэша, использующего технологию CXL для решения одной из ключевых проблем современных AI-систем — ограничения пропускной способности и объёма памяти, известного как «memory wall». Новая система получила название MemoryAI KV cache server и ориентирована на ускорение инференса в корпоративных и агентных AI-сценариях.

В отличие от обучения моделей, которое преимущественно ограничено вычислительными ресурсами, инференс в реальном времени зависит в первую очередь от памяти и задержек. По оценкам компании, до 70% таких нагрузок определяется именно характеристиками памяти, что приводит к простою GPU и снижению эффективности кластеров. Новый сервер решает эту проблему за счёт значительного увеличения доступного объёма памяти: система сочетает до 3 ТБ DDR5 и до 8 карт расширения CXL по 1 ТБ каждая, доводя суммарный объём до 11 ТБ.

Использование CXL-памяти позволяет создать дополнительный уровень в иерархии памяти, дополняющий HBM и традиционную DRAM, и обеспечивающий существенно более быстрый доступ к данным по сравнению с NVMe-накопителями. Это критично для задач с большими контекстными окнами, включая генерацию с дополнением извлечением (RAG), анализ финансовых данных и обработку регуляторной информации в реальном времени. Расширенная память также снижает необходимость повторных вычислений, повышает загрузку GPU и ускоряет обработку данных.

Сервер совместим с архитектурой NVIDIA Dynamo от NVIDIA, что упрощает интеграцию в существующие AI-инфраструктуры и позволяет эффективно выгружать KV-кэш из GPU-памяти. Это даёт возможность гибко масштабировать кластеры, оптимизируя баланс между вычислительными и память-ориентированными ресурсами.

По словам технического директора Penguin Solutions Фила Покорны, внедрение CXL-ориентированных решений позволяет существенно сократить время до получения первого токена, ускорить генерацию ответов и увеличить общую пропускную способность систем. При этом достигается не только рост производительности, но и повышение энергоэффективности по сравнению с традиционными GPU-серверами с эквивалентной конфигурацией.

MemoryAI KV cache server уже используется рядом клиентов для оптимизации производительности AI-кластеров и обеспечения стабильного соблюдения SLA в условиях растущих требований к моделям, объёму контекста и параллелизму вычислений. Решение будет продемонстрировано на конференции NVIDIA GTC 2026, где компания представит его как один из ключевых элементов инфраструктуры для масштабируемого AI-инференса.

Об авторе

Александр Перевозчиков

Editor

Просмотреть все записи

Навигация записи

Предыдущий Kioxia представила SSD нового класса с прямым доступом GPU к флеш-памяти для AI-нагрузок
Следующий: ASUS обновила линейку TUF Gaming: новые A16, F16 и A18 с OLED-дисплеями и RTX 5070 Ti
Сайт производителя блоков питания Raijintek серии CRATOS
ASUS ROG Zephyrus Duo 2026: новый уровень производительности. Подробнее на официальном сайте

PC Review.kz

PC Reviews – новое издание, с материалами освещающими новинки из мира ПК. На страницах сайта вы найдете множество интересных и полезных материалов не только о ПК, но и о многих других устройствах, приложениях, технологиях.

Мы стараемся публиковать качественные материалы, с подробными тестами, качественными фотографиями и полезными советами. На страницах нашего ресурса вы найдете обзоры не только компонентов ПК, например видеокарт, материнских плат, процессоров или блоков питания, но и распаковки ноутбуков, моноблоков и смартфонов.

Мы не забываем и про новости, каждый день публикуя на сайте множество материалов, которые не просто проинформируют Вас о выходе той или иной новинки, но и позволят «успеть» к распродаже в сети магазинов или проинформируют о том, на что не нужно обращать даже внимания.

До встречи на страницах нашего издания!
С уважением, команда PC Review.kz.

Мы ВКонтакте

Авторское право © 2026 Все права зарезервированы. | ReviewNews от AF themes.