AMD выпустила ROCm 6.4 с техническими улучшениями, но без поддержки RDNA 4

AMD выпустила ROCm 6.4 с техническими улучшениями, но без поддержки RDNA 4

AMD официально представила ROCm 6.4, новейший стек вычислений на GPU с открытым исходным кодом. Обновление привносит ряд внутренних улучшений, но, к сожалению, официальной поддержки RDNA 4 пока нет. ((Жаль, конечно, что RDNA 4 осталась за бортом, но и без нее есть на что посмотреть!))

ROCm 6.4 улучшает совместимость между пользовательскими библиотеками ROCm и драйвером ядра AMDKFD, упрощая работу с широким спектром ядер Linux. AMD также расширила внутреннее тестирование, охватив больше комбинаций пользовательских и ядерных версий, что должно уменьшить сложности интеграции для HPC и AI-нагрузок. ((Это определенно плюс для разработчиков! Меньше головной боли с совместимостью.))

Что касается фреймворков, ROCm 6.4 теперь поддерживает PyTorch 2.5 и 2.6 “из коробки”, позволяя разработчикам использовать новейшие функции глубокого обучения без необходимости сборки из исходников. Интеграция с Megatron-LM добавляет три новых объединенных ядра: Attention (QKV), Layer Norm и ROPE, ускоряя обучение моделей-трансформеров путем комбинирования нескольких операций в один проход GPU. ((Заметное ускорение обучения – это всегда хорошо!)) Декодирование видео также получило улучшения благодаря поддержке VP9 в rocDecode и rocPyDecode, а также новому модулю чтения битового потока для оптимизации медиаконвейеров.

ROCm 6.4 теперь официально поддерживает Oracle Linux 9, а рабочая станция Radeon PRO W7800 48 GB прошла валидацию. AMD также включила режим CPX с конфигурациями памяти NPS4, ориентируясь на сценарии с высокой пропускной способностью памяти на ускорителях MI Instinct. ((Расширение списка поддерживаемых платформ и конфигураций – это всегда плюс!))

Несмотря на эти обновления, ROCm 6.4 официально не поддерживает графические процессоры RDNA 4, такие как серия RX 9070. Хотя сообщество сообщает о неофициальной работе новой версии на этих картах, отсутствие официальной поддержки означает, что удвоенная пропускная способность FP16, восьмикратное ускорение разреженности INT4 и возможности FP8 RDNA 4 остаются в значительной степени неиспользованными в рабочих процессах ROCm. В Linux поддержка потребительских Radeon ограничена всего несколькими моделями, хотя охват Windows для семейств RDNA 2 и 3 расширился с 2022 года. ((Вот это, пожалуй, главный минус. Ждем официальной поддержки RDNA 4!))

В преддверии июньского мероприятия AMD “Advancing AI” многие разработчики надеются на анонс интеграции RDNA 4. До тех пор те, кому нужна гарантированная поддержка GPU с первого дня, могут продолжать рассматривать альтернативные экосистемы.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *