NVIDIA представила CUDA 13.1 с революционной технологией CUDA Tile — новым уровнем абстракции для программирования GPU

NVIDIA объявила о крупнейшем обновлении платформы CUDA с момента её появления в 2006 году. Версия CUDA 13.1 приносит с собой CUDA Tile — новую парадигму программирования, ориентированную на работу с тайлами данных и позволяющую писать высокопроизводительный GPU-код на более высоком уровне абстракции. Эта технология вводит виртуальный набор инструкций, скрывающий сложность специализированного оборудования, включая тензорные ядра, и делает алгоритмы совместимыми с будущими поколениями GPU без необходимости глубокого переписывания.

На протяжении многих лет CUDA оставалась фундаментом SIMT-программирования, предоставляя разработчикам мощные, но достаточно низкоуровневые инструменты. Такой подход открывал широкие возможности оптимизации, но требовал значительных усилий при переносе кода между архитектурами и работе с ускорителями тензорных вычислений. В последние годы тензоры стали ключевым типом данных в задачах ИИ, что привело к созданию аппаратных блоков вроде Tensor Cores и Tensor Memory Accelerators. С усложнением железа возникла необходимость в более абстрактном программировании — эту роль и выполняет CUDA Tile. Разработчик работает с тайлами — логическими блоками данных, определяя операции над ними, а компилятор и среда исполнения сами распределяют вычисления по потокам, памяти и тензорным ядрам. Такой подход напоминает работу с высокоуровневыми библиотеками в Python, где матричные операции скрывают огромный объём внутренней оптимизации.

Ключевым элементом технологии является CUDA Tile IR — новый промежуточный слой, который делает тайловое программирование нативным для GPU NVIDIA и дополняет PTX, традиционно используемый для SIMT. Он позволяет разработчикам и создателям DSL-языков строить собственные компиляторы и фреймворки, опираясь на абстракции работы с плитками данных и не зависеть от особенностей текущих поколений архитектур. CUDA Tile не заменяет SIMT, а работает параллельно: разработчик может использовать оба подхода в одном проекте, применяя тайловое программирование там, где задействованы тензорные операции.

Большинство программистов столкнётся с новой технологией через инструменты высокого уровня, включая NVIDIA cuTile Python — реализацию тайлового программирования для языка Python с использованием CUDA Tile IR в качестве бэкенда. Более глубокие возможности раскроются перед разработчиками компиляторов, библиотек и специализированных языков, которым предоставляется подробная спецификация CUDA Tile IR с описанием синтаксиса, семантики и абстракций.

CUDA 13.1 и технология CUDA Tile знаменуют собой важный шаг в развитии GPU-программирования. NVIDIA делает вычисления на тензорных ядрах более доступными, а переносимость кода — проще, подготавливая экосистему к новым задачам искусственного интеллекта и следующему поколению ускорителей.