Перейти к содержимому
PC Review.kz

PC Review.kz

Интересные обзоры и тесты видеокарт, процессоров, ноутбуков и комплектующих. Бенчмарки, сравнения, советы по выбору ПК в Казахстане.

Реклама ноутбука ASUS ROG Zephyrus Duo 2026
Основное меню
  • НОВОСТИ
    • Новости Software
    • Новости Hardware
  • ОБЗОРЫ
    • Ноутбуки
    • Процессоры
    • Материнские платы
    • Видеокарты
    • Водяное охлаждение
    • Оперативная память
    • Накопители
    • Блоки питания
    • Корпуса
    • Звуковые карты
    • Кулера
    • Периферия
    • Сетевые устройства
  • ЭКСПЕРИМЕНТЫ
  • РЕДАКЦИЯ
  • Переключатель языка
Кнопка: светлая/темная
Подписка
  • Главная
  • Новости
  • AMD раскрыла потенциал Instinct MI355X: новый движок ATOM ускоряет инференс современных LLM и MoE-моделей
  • Новости
  • Новости Hardware
  • Новости Software

AMD раскрыла потенциал Instinct MI355X: новый движок ATOM ускоряет инференс современных LLM и MoE-моделей

Александр Перевозчиков 13.01.2026 1 минуты чтение
MjyBNQMK8ktlLg5y

На фоне стремительного роста нагрузок, связанных с генеративным ИИ и большими языковыми моделями, AMD рассказала о существенном прогрессе в оптимизации инференс-инфраструктуры для современных сценариев рассуждений и агентных рабочих процессов. Компания делает ставку не только на универсальные фреймворки вроде vLLM и SGLang, но и на собственный специализированный движок ATOM, который, по заявлению разработчиков, позволяет наиболее полно раскрыть возможности ускорителей Instinct MI355X в задачах, насыщенных MoE-архитектурами и многошаговыми вычислениями.

За последние месяцы инженеры AMD сосредоточились на повышении эффективности как одиночных узлов, так и распределённых конфигураций при работе с моделью DeepSeek-R1 — открытым reasoning-ориентированным LLM, активно использующим MLA-внимание и разреженные MoE-эксперты. Ключом к росту производительности стало сочетание глубоко оптимизированных и объединённых вычислительных ядер для основных примитивов LLM, лёгкого инференс-движка ATOM с управлением планированием, батчингом и KV-кэшем, а также доработанной поддержки распределённого инференса. Сам ATOM был выложен в открытый доступ и может использоваться как самостоятельное решение или в роли бэкенда для популярных фреймворков.

В сценариях одиночного узла MI355X с ATOM демонстрирует стабильную и высокую производительность при различных уровнях параллелизма, включая режимы, критически важные для снижения стоимости токена в промышленных развёртываниях. По данным AMD, на высоких уровнях конкурентности ускоритель способен соответствовать или превосходить системы на базе NVIDIA Blackwell B200, работающие с существующими инференс-фреймворками, сохраняя преимущества при разных длинах последовательностей — от интерактивных диалогов до длительной генерации.

Не менее убедительно MI355X выглядит и в распределённых конфигурациях. Оптимизированная обработка MoE-диспетчеризации, агрегации экспертов и трафика KV-кэша позволяет GPU эффективно масштабироваться на несколько узлов. В чувствительных к задержкам сценариях, характерных для пользовательских сервисов, решения AMD показывают более высокий выход токенов на GPU при сопоставимой интерактивности, что делает платформу привлекательной для real-time инференса. При этом поддерживаются продвинутые стратегии параллелизма, включая экспертный параллелизм и разделение стадий prefill и decode.

В AMD подчёркивают, что работа над оптимизациями продолжается. В ближайших планах — дальнейшее исследование конфигураций с большим числом экспертов, углублённая фьюзия операторов для крупных MoE-моделей и улучшение обслуживания длинных контекстов. Все описанные наработки уже интегрированы в открытое ПО, что позволяет сообществу воспроизводить результаты и адаптировать ATOM под собственные задачи.

Суммируя итоги, AMD позиционирует Instinct MI355X как конкурентоспособную и открытую платформу для следующей волны GenAI-инференса, где решающую роль играют масштабируемость, эффективность и прозрачность программной экосистемы. Компания уточняет, что приведённые данные основаны на внутренних измерениях по состоянию на декабрь 2025 года и носят информационный характер.

Об авторе

Александр Перевозчиков

Editor

Просмотреть все записи

Навигация записи

Предыдущий MSI и NVIDIA представили киберспортивный монитор MPG 272QRF X36 с частотой 360 Гц и технологией G-SYNC Pulsar
Следующий: ASUS представила ROG Strix B860-F Gaming Wi-Fi — сбалансированную плату для Core Ultra без разгона
Сайт производителя блоков питания Raijintek серии CRATOS
ASUS ROG Zephyrus Duo 2026: новый уровень производительности. Подробнее на официальном сайте

Популярные записи

  • NVIDIA и Meta объявили о стратегическом партнёрстве для развития ИИ-инфраструктуры нового поколения
  • Секретное оружие XFX: Как память от Samsung делает видеокарты тише и эффективнее
  • CannonKeys представила Wood Bakeneko65 — кастомную механическую клавиатуру из дерева за $380
  • ASUS и GoPro объединились, чтобы революционизировать 360-видео: представлено ИИ-приложение StoryCube
  • Монитор из будущего: MSI представила QD-OLED дисплей с ИИ и частотой 500 Гц

PC Review.kz

PC Reviews – новое издание, с материалами освещающими новинки из мира ПК. На страницах сайта вы найдете множество интересных и полезных материалов не только о ПК, но и о многих других устройствах, приложениях, технологиях.

Мы стараемся публиковать качественные материалы, с подробными тестами, качественными фотографиями и полезными советами. На страницах нашего ресурса вы найдете обзоры не только компонентов ПК, например видеокарт, материнских плат, процессоров или блоков питания, но и распаковки ноутбуков, моноблоков и смартфонов.

Мы не забываем и про новости, каждый день публикуя на сайте множество материалов, которые не просто проинформируют Вас о выходе той или иной новинки, но и позволят «успеть» к распродаже в сети магазинов или проинформируют о том, на что не нужно обращать даже внимания.

До встречи на страницах нашего издания!
С уважением, команда PC Review.kz.

Мы ВКонтакте

Авторское право © 2026 Все права зарезервированы. | ReviewNews от AF themes.