Intel и SambaNova представили новую архитектуру для Agentic AI: ставка на гибрид вычислений

Intel и SambaNova представили новую архитектуру для Agentic AI: ставка на гибрид вычислений

Компании SambaNova Systems и Intel объявили о следующем этапе сотрудничества, представив новую гетерогенную архитектуру для задач искусственного интеллекта. Речь идет о комплексном решении, которое объединяет графические ускорители, процессоры Intel Xeon 6 и специализированные ускорители SambaNova RDU. Такая связка ориентирована на высокопроизводительный инференс — прежде всего для так называемых agentic AI-систем, которые уже выходят из стадии экспериментов в реальное применение.

Новая архитектура распределяет задачи между разными типами вычислительных ресурсов. Графические процессоры отвечают за начальную обработку запросов, превращая длинные входные данные в удобный для работы формат. Далее в работу вступают Xeon 6, которые выполняют роль управляющего центра: координируют задачи, обрабатывают вызовы API, управляют логикой агентов и выполняют код. Завершающий этап — генерация ответов — ускоряется с помощью RDU, оптимизированных для быстрой и энергоэффективной работы с языковыми моделями.

Такой подход отражает новую реальность рынка: современные AI-агенты уже не просто генерируют текст, а выполняют сложные сценарии — пишут и компилируют код, обращаются к базам данных, взаимодействуют с внешними сервисами и координируют процессы. В этих условиях классические GPU-ориентированные системы начинают упираться в ограничения, и ключевую роль все чаще играют CPU и специализированные ускорители.

В Intel подчеркивают, что именно экосистема x86 по-прежнему остается основой корпоративного ПО, а значит, использование Xeon 6 позволяет безболезненно интегрировать новые AI-нагрузки в существующую инфраструктуру. В свою очередь, SambaNova делает ставку на свои RDU, которые должны повысить эффективность инференса и снизить стоимость обработки запросов за счет высокой пропускной способности и низких задержек.

По внутренним тестам SambaNova, Xeon 6 демонстрирует заметный прирост производительности в задачах, связанных с AI-разработкой: компиляция кода может выполняться более чем на 50% быстрее по сравнению с ARM-серверами, а работа с векторными базами данных — до 70% быстрее относительно других x86-решений. Это напрямую влияет на скорость создания и развертывания AI-агентов — от идеи до рабочего продукта.

Новая архитектура рассчитана на масштабные внедрения: от корпоративных дата-центров до облачных провайдеров и национальных AI-программ. При этом важным преимуществом остается возможность развертывания в существующих инфраструктурах с воздушным охлаждением, без необходимости кардинальной перестройки дата-центров.

Ожидается, что коммерческая доступность решения начнется во второй половине 2026 года. Этот шаг фактически закрепляет переход индустрии к гибридным вычислительным моделям, где ни один тип чипов не доминирует, а эффективность достигается за счет их грамотной комбинации.