Революция на серверах: IBM выпускает ускоритель Spyre для "агентивного" ИИ

Революция на серверах: IBM выпускает ускоритель Spyre для "агентивного" ИИ

Корпорация IBM сделала важный шаг в развитии корпоративных вычислений, объявив о скором выпуске IBM Spyre Accelerator — нового аппаратного ускорителя, специально разработанного для работы с требовательными моделями генеративного и агентивного искусственного интеллекта. Этот чип позволит корпоративным клиентам запускать передовые ИИ-функции, включая сложные системы ИИ-агентов, прямо на своих мощных системах, не жертвуя при этом безопасностью и надежностью критически важных данных.

Сегодняшний ИТ-ландшафт стремительно меняется: на смену традиционным логическим задачам приходят агентивные ИИ-системы, которым для принятия решений требуется моментальная реакция и минимальная задержка (low-latency inferencing). IBM Spyre Accelerator был создан как раз для того, чтобы удовлетворить этот спрос. Он позволяет мейнфреймам и серверам, которые обрабатывают самые ответственные и требовательные рабочие нагрузки, запускать новейшие ИИ-модели, сохраняя при этом безопасность ключевых данных, транзакций и приложений. Ключевым преимуществом является возможность сохранять все критически важные данные локально (on-prem), что существенно снижает риски и повышает операционную и энергетическую эффективность.

От исследований до корпоративных систем

Создание Spyre Accelerator — это яркий пример успешного внедрения результатов исследований IBM в коммерческий продукт. Прототип чипа, разработанный в Центре аппаратного обеспечения ИИ IBM Research, прошел ускоренный путь развития и тестирования, включая развертывания в кластерах и сотрудничество с ведущими университетами.

В итоге прототип превратился в коммерческий продукт: Spyre Accelerator представляет собой полноценную систему-на-чипе (System-on-a-Chip) с 32 индивидуальными ускорительными ядрами и ошеломляющим количеством в 25,6 миллиарда транзисторов. Произведенный по 5 нм техпроцессу, чип монтируется на стандартную 75-ваттную плату PCIe. Это позволяет клиентам масштабировать возможности ИИ, устанавливая до 48 карт в системах IBM Z или LinuxONE, или до 16 карт в серверах IBM Power.

Безопасность и скорость для корпоративного ИИ

Как отметил Барри Бейкер, главный операционный директор IBM Infrastructure, Spyre Accelerator расширяет возможности систем IBM для поддержки мультимодального ИИ, включая генеративный и агентивный. Это позволяет клиентам масштабировать свои миссионно-критические рабочие нагрузки с беспрецедентной безопасностью, отказоустойчивостью и эффективностью.

Для клиентов IBM Z и LinuxONE ускоритель Spyre, работающий в тандеме с процессором Telum II, обеспечивает исключительно низкую задержку и высокую скорость обработки транзакций. Такая связка позволяет бизнесу использовать мощь ИИ для прогностических задач, например, для продвинутого обнаружения мошенничества или автоматизации розничной торговли.

В случае с серверами IBM Power клиенты смогут использовать целый каталог ИИ-сервисов с установкой в один клик. Spyre Accelerator для Power, дополненный встроенным на чипе ускорителем (MMA), демонстрирует высокую пропускную способность для глубокой интеграции процессов. Например, он позволяет обработать более 8 миллионов документов для интеграции в базу знаний всего за час при размере подсказки (prompt size) 128. Эта производительность, объединенная с программным стеком, безопасностью и энергоэффективностью IBM, критически важна для компаний, внедряющих генеративные ИИ-фреймворки в свои основные бизнес-процессы.

Сроки доступности

Ранее IBM анонсировала, что Spyre Accelerator будет доступен в системах IBM z17, LinuxONE 5 и Power11.

  • Для систем IBM z17 и LinuxONE 5 ускоритель станет общедоступен 28 октября этого года.
  • Для серверов Power11 его выпуск ожидается в начале декабря.

Это знаковое событие, поскольку Spyre — это первый коммерческий чип, вышедший из Центра аппаратного обеспечения ИИ IBM Research, созданного в 2019 году, задолго до нынешнего бума больших языковых моделей.