SoftBank и AMD тестируют совместное распределение ресурсов Instinct GPU для ИИ-инфраструктуры нового поколения

SoftBank и AMD тестируют совместное распределение ресурсов Instinct GPU для ИИ-инфраструктуры нового поколения

Корпорации SoftBank и AMD объявили о начале совместной валидации графических ускорителей AMD Instinct для перспективных ИИ-платформ. В центре проекта находится механизм гибкого разделения ресурсов GPU, позволяющий одному ускорителю одновременно обслуживать несколько ИИ-нагрузок без характерных для таких сценариев задержек и перерасхода вычислительных мощностей.

Для этого SoftBank разработала собственную систему оркестрации, которая динамически распределяет ресурсы ускорителя в зависимости от требований конкретной задачи — размера модели, количества параллельных запусков и потребностей в памяти. Вместо традиционного подхода с одинаковым выделением ресурсов GPU система разбивает вычислительную нагрузку на несколько логических экземпляров, работающих на отдельных Accelerator Complex Die. В зависимости от сценария конфигурация может варьироваться от одного экземпляра до восьми, а высокоскоростная память HBM при этом делится на изолированные области, что позволяет избежать скачков задержек и конфликтов доступа к данным.

По словам SoftBank, такой подход позволяет запускать несколько ИИ-приложений на одном ускорителе с минимальной нагрузкой на ресурсы и без типичных проблем, когда GPU либо простаивает, либо, наоборот, оказывается перегружен. Конкретные показатели производительности пока не раскрываются, однако компания подчёркивает, что новая схема особенно эффективно подходит для малых и средних языковых моделей, где традиционные методы распределения ресурсов часто оказываются неэффективными.

В SoftBank также заявили, что рассматривают возможность применения аналогичной системы оркестрации и для других ИИ-ускорителей, не ограничиваясь только решениями AMD. Публичная демонстрация технологии запланирована на стенде AMD в рамках выставки MWC Barcelona 2026, которая пройдёт в Барселоне с 2 по 5 марта 2026 года. Дополнительные технические подробности об архитектуре и методах управления оркестратором уже опубликованы в блоге Research Institute of Advanced Technology, принадлежащем SoftBank.

На фоне этого сотрудничества стоит отметить, что в отрасли сохраняется неопределённость вокруг будущих ускорителей AMD. Ранее сообщалось, что следующее поколение Instinct MI455X, которое должно конкурировать с платформой NVIDIA Vera Rubin, сталкивается с серьёзными производственными трудностями. По имеющимся данным, в текущем году ожидается лишь ограниченный выпуск этих ускорителей, тогда как массовое производство может быть перенесено на второй квартал 2027 года, что способно скорректировать планы AMD на рынке высокопроизводительных ИИ-решений.