Компания AMD продолжает работу над графической архитектурой следующего поколения RDNA 5, которая, по имеющимся данным, уже находится на завершающей стадии проектирования. Новые подробности о будущей архитектуре появились благодаря изменениям, обнаруженным в репозитории компилятора LLVM.
Согласно опубликованным данным, архитектура RDNA 5, также известная под внутренним обозначением GFX1310, получит серьёзные улучшения в обработке вычислений. Одним из ключевых нововведений станет полноценная реализация конвейера Dual-Issue VALU для режима Wave32. Эта технология позволяет выполнять векторные операции одновременно на двух арифметико-логических блоках графического процессора — X и Y. Благодаря этому GPU сможет обрабатывать больше инструкций за один такт и эффективнее использовать вычислительные ресурсы.
Дополнительные изменения затрагивают расширение набора инструкций, которые могут выполняться в режиме двойного выпуска. В частности, архитектура позволит параллельно обрабатывать больше вариантов операций fused multiply-add и других векторных инструкций. Одновременно разработчики ослабили некоторые ограничения, связанные с регистрами, что упростит работу компиляторов и позволит шейдерному коду эффективнее выполнять операции с плавающей точкой в режиме Wave32.
В результате таких изменений ожидается заметное увеличение уровня загрузки вычислительных блоков при работе с FP32-операциями. Для игровой индустрии это особенно важно, поскольку современные графические движки активно используют именно вычисления FP32 при обработке вершинных и пиксельных шейдеров. Повышение эффективности выполнения этих операций должно приблизить реальную производительность графических процессоров к их теоретическому пиковому уровню.
Стоит отметить, что элементы Dual-Issue VALU впервые появились в архитектуре RDNA 3, которая легла в основу видеокарт серии Radeon RX 7000. Однако в том поколении реализация оказалась неполной. Поддержка распространялась лишь на ограниченное число инструкций, ряд вариантов FMA не работал в двойном режиме, а строгие требования к разделению регистров часто мешали компиляторам задействовать эту возможность. В результате многие шейдеры не могли эффективно использовать параллельные вычислительные блоки, а фактическая производительность FP32 заметно уступала теоретическим показателям.
В новой архитектуре RDNA 5 эти ограничения, по всей видимости, будут устранены, что позволит значительно повысить эффективность вычислений и улучшить игровую производительность.
Хотя точные характеристики будущих графических процессоров пока не раскрыты, специалисты постепенно восстанавливают детали архитектуры благодаря патчам и изменениям в компиляторе. Ожидается, что RDNA 5 может дебютировать уже в ближайшее время и принесёт ряд новых технологий, включая нейронный рендеринг, масштабирование изображения с использованием машинного обучения, продвинутую генерацию кадров и значительно улучшенную трассировку лучей. Некоторые из этих решений связывают с экспериментальным проектом компании под названием FSR Diamond.
Если заявленные изменения подтвердятся в финальных продуктах, новое поколение графических процессоров AMD может обеспечить заметный скачок производительности в современных играх и вычислительных задачах.
