Компании AMD и Oracle объявили о значительном расширении своего стратегического партнерства, нацеленного на ускоренное развитие инфраструктуры искусственного интеллекта. В результате этого сотрудничества в облачной среде Oracle Cloud Infrastructure (OCI) появится первый в мире публично доступный AI-суперкластер, работающий на базе новейших ускорителей AMD Instinct MI450 Series.
Масштаб проекта поражает: планируется, что к третьему кварталу 2026 года кластер начнет работу с 50 000 единиц MI450, а в течение 2027 года будет продолжено дальнейшее расширение.
«Гелиос»: Архитектура Будущего в Облаке
Новая инфраструктура станет логичным развитием существующих предложений Oracle, использующих GPU AMD Instinct MI300X и MI355X. В ее основе будет лежать инновационный стоечный дизайн AMD под кодовым названием «Helios». Каждая стойка «Гелиоса» представляет собой вершину инженерной мысли: она объединяет ускорители Instinct MI450, процессоры EPYC «Venice» и DPU-процессоры Pensando «Vulcano». При этом вся система использует жидкостное охлаждение, что не только резко повышает производительность, но и значительно снижает эксплуатационные расходы.
Грядущие ускорители MI450 демонстрируют прорывные характеристики: до 432 ГБ сверхбыстрой памяти HBM4 и пропускную способность 20 ТБ/с на каждый графический процессор. Эта беспрецедентная память позволит клиентам обучать модели ИИ, которые на 50% крупнее по сравнению с предыдущими поколениями, полностью в памяти GPU, что устраняет необходимость в трудоемком разделении моделей.
Сетевая Связь, Исключающая Узкие Места
Чтобы обеспечить максимальную эффективность такой масштабной системы, AMD использует свои новые стандарты межсоединений UALink и UALoE. Эти технологии позволяют графическим процессорам напрямую обмениваться данными с аппаратной согласованностью, что значительно снижает задержки и устраняет необходимость маршрутизации через центральный процессор.
Для внешнего подключения каждая видеокарта MI450 может быть оснащена до тремя AI-NIC Pensando «Vulcano» со скоростью 800 Гбит/с. Эти сетевые карты поддерживают продвинутые стандарты RoCE и UEC (Ultra Ethernet Consortium), обеспечивая высокоскоростную распределенную тренировку с минимальными потерями данных. За надежность и безопасность кластера отвечают процессоры AMD EPYC «Venice» с функциями конфиденциальных вычислений, а работа всей экосистемы поддерживается открытым программным стеком AMD ROCm, что обеспечивает гибкость и упрощает миграцию существующих рабочих нагрузок.
В конечном итоге, благодаря передовым технологиям, таким как тонкая виртуализация и разделение GPU, а также мощному «головному узлу» на базе EPYC, новый суперкластер AMD и Oracle предложит клиентам не просто облачные мощности, а полностью оптимизированную, безопасную и масштабируемую платформу для создания и развертывания самых требовательных моделей искусственного интеллекта.

