Red Hat и Rebellions представляют OpenShift AI на базе энергоэффективных NPU для корпоративного ИИ

Red Hat и Rebellions представляют OpenShift AI на базе энергоэффективных NPU для корпоративного ИИ

Red Hat совместно с Rebellions анонсировали Red Hat OpenShift AI, интегрирующий масштабируемые и гибкие возможности ИИ-инференса с энергоэффективными нейропроцессорами (NPU) Rebellions. Новое решение позволяет создать полностью проверенную корпоративную AI-платформу, поддерживающую любые модели, любые ускорители и любые облачные среды, что соответствует стратегии Red Hat по предоставлению максимальной свободы выбора архитектур для ИИ-нагрузок.

По мере того как организации внедряют ИИ в реальные бизнес-кейсы, перед ними встают новые вызовы: высокие затраты на инфраструктуру, сложность развёртывания и необходимость безопасной и гибкой среды. Традиционные GPU-ориентированные решения не всегда способны обеспечить требуемую производительность и эффективность при масштабировании. Red Hat OpenShift AI с Rebellions NPU позволяет решать эти задачи, обеспечивая более эффективное использование ресурсов и снижение затрат на серверы и стойки.

Архитектура NPU Rebellions оптимизирована под ИИ-инференс, обеспечивая высокую энергоэффективность по сравнению с традиционными GPU. Специализированное программное обеспечение и поддержка популярных открытых AI-фреймворков создают удобную среду разработки, сопоставимую с GPU-решениями. Полностью интегрированное решение от аппаратного уровня до сервиса моделей было проверено Red Hat и Rebellions на совместимость корпоративного класса. NPU Operator Rebellions, сертифицированный для OpenShift, обеспечивает бесшовную интеграцию и поддержку как локальных, так и многооблачных развертываний, помогая соблюсти требования к хранению данных и нормативные стандарты.

Решение позволяет запускать крупные языковые модели и ИИ-инференс с высокой пропускной способностью и низкой задержкой, сокращает энергопотребление и упрощает управление NPU так же, как GPU. Оно обеспечивает безопасность данных, масштабируемость и возможность развёртывания как в центрах обработки данных, так и на периферии, создавая гибкую платформу для корпоративного ИИ.