AMD выпустила Ryzen AI Software 1.7 с поддержкой MoE-моделей, VLM и ускоренной BF16-инференцией

AMD представила релиз Ryzen AI Software 1.7 — крупное обновление программного стека для локального запуска и разработки ИИ-приложений на APU компании, сочетающих NPU и встроенную графику. Новая версия нацелена на снижение трения в повседневных рабочих процессах разработчиков, расширение спектра поддерживаемых моделей и более предсказуемую производительность при инференсе на потребительских и профессиональных системах.

Одним из ключевых нововведений стала поддержка новых архитектур, включая GPT-OSS на базе подхода Mixture-of-Experts и визуально-языковую модель Gemma-3 4B. MoE-модели позволяют динамически маршрутизировать токены между специализированными «экспертами», что даёт возможность запускать более мощные языковые модели без пропорционального роста вычислительных затрат. В свою очередь, появление VLM-архитектур открывает путь к мультимодальным сценариям, где текстовая логика дополняется анализом изображений, будь то визуальный поиск, генерация описаний или построение гибридных агентных систем. Важно и то, что разработчики теперь могут сравнивать плотные, MoE- и мультимодальные модели в одинаковых условиях на одном и том же NPU, выбирая оптимальный вариант под конкретные задачи.

Не менее заметным шагом стало включение Stable Diffusion непосредственно в основной установщик Ryzen AI. Ранее для работы с генерацией изображений требовалась отдельная среда со своим набором зависимостей, тогда как теперь текстовые, визуальные и гибридные ИИ-проекты разворачиваются в едином инструментальном контуре. Это упрощает настройку, сокращает время на подготовку окружения и ускоряет прототипирование приложений, где генерация изображений тесно связана с языковыми моделями.

В Ryzen AI Software 1.7 также расширены возможности работы с длинным контекстом. Большинство поддерживаемых LLM теперь способны обрабатывать до 16 тысяч токенов при гибридном запуске на iGPU и NPU. Это особенно важно для сценариев с анализом длинных документов, сложных диалогов или локальных RAG-систем, где увеличение контекста напрямую снижает потери информации и повышает точность ответов.

Отдельного внимания заслуживает оптимизация BF16-пайплайна. По сравнению с версией 1.6 задержки инференса снижены почти вдвое, что заметно повышает отзывчивость интерактивных приложений и ускоряет вывод первого токена. Выигрыш ощущается как на стандартных моделях, так и на дообученных решениях, делая локальные ИИ-сценарии более пригодными для реального использования.

В целом релиз Ryzen AI Software 1.7 делает локальную разработку ИИ на платформах AMD более целостной и зрелой: меньше ручной настройки, больше выбора архитектур и ощутимо более высокая производительность. Для разработчиков, ориентированных на on-device LLM и мультимодальные приложения, это означает более быстрые итерации и готовность к внедрению сложных функций без ухода в облако.