NVIDIA ускоряет локальный ИИ на ПК: новые RTX-обновления делают генерацию видео и работу с ИИ заметно быстрее

2025 год стал переломным для развития искусственного интеллекта на персональных компьютерах. Малые языковые модели, рассчитанные на запуск на ПК, почти вдвое повысили точность по сравнению с 2024 годом и существенно сократили разрыв с крупными облачными LLM. Параллельно повзрослели инструменты для локальной разработки ИИ — такие как Ollama, ComfyUI, llama.cpp и Unsloth, — а их аудитория выросла в разы. Всё это подготовило почву для массового распространения генеративного ИИ среди обычных пользователей, от создателей контента до геймеров и тех, кто использует ПК для работы и учёбы.

На CES NVIDIA объявила о крупной волне обновлений для устройств на базе GeForce RTX, NVIDIA RTX PRO и настольного суперкомпьютера DGX Spark. Эти улучшения направлены на то, чтобы дать разработчикам и энтузиастам больше производительности и памяти для запуска сложных ИИ-сценариев прямо на локальном ПК, без обращения к облаку, сохраняя при этом низкие задержки, конфиденциальность и контроль над данными.

Ключевым направлением стала генерация изображений и видео. Благодаря оптимизациям PyTorch-CUDA и поддержке новых форматов точности NVFP4 и NVFP8 в ComfyUI, производительность генеративного ИИ для видео и изображений выросла до трёх раз, а потребление видеопамяти сократилось до 60 процентов. В ComfyUI также появилась интеграция RTX Video Super Resolution, ускоряющая генерацию и апскейл видео до 4K, а открытая версия модели LTX-2 от Lightricks получила оптимизации под NVFP8, что делает её одной из самых продвинутых локальных систем для аудио-видеогенерации.

NVIDIA также представила новый конвейер генерации видео, который позволяет художникам и разработчикам создавать управляемые 4K-ролики, используя 3D-сцены в Blender. Такой подход даёт точный контроль над результатом и при этом работает значительно быстрее, чем традиционные облачные сервисы. Модель LTX-2 способна генерировать до 20 секунд видео в 4K с высоким уровнем визуальной детализации, встроенным звуком и поддержкой нескольких ключевых кадров, что выводит локальное видеотворчество на новый уровень.

Существенные изменения коснулись и работы с языковыми моделями. Совместно с сообществом open source NVIDIA добилась прироста производительности инференса малых языковых моделей до 35 процентов в llama.cpp и до 30 процентов в Ollama, особенно для архитектур mixture-of-experts. Эти улучшения уже доступны и вскоре появятся в популярных приложениях вроде LM Studio и новых агентных систем, включая MSI AI Robot.

Отдельное внимание было уделено поиску данных на ПК. Nexa.ai представила обновлённую версию локального поискового агента Hyperlink, который с ускорением RTX превращает компьютер в интеллектуальную базу знаний. Теперь система умеет не только анализировать документы и изображения, но и искать по видеоконтенту, распознавая объекты, действия и речь. Вся обработка происходит локально, что выгодно отличает решение с точки зрения приватности и скорости.

Для стримеров и тех, кто активно общается по видеосвязи, NVIDIA обновила приложение Broadcast до версии 2.1. Виртуальный ключевой свет стал доступен на более широком круге видеокарт, лучше адаптируется к сложным условиям освещения и предлагает более гибкую настройку цветовой температуры, приближая картинку к уровню профессиональных студий.

Наконец, NVIDIA показала, как может выглядеть домашняя ИИ-студия с использованием DGX Spark. Этот компактный настольный суперкомпьютер получил обновления, увеличившие его производительность до 2,6 раза всего за несколько месяцев с момента запуска. Spark рассчитан на разработчиков и креаторов, которым нужно параллельно экспериментировать с языковыми моделями, агентными системами или генерацией ассетов, не нагружая основной рабочий ПК.

В совокупности все эти анонсы демонстрируют, что NVIDIA делает ставку на перенос всё более сложных ИИ-задач с облака на локальные RTX-системы, превращая обычный ПК в полноценную платформу для творчества, разработки и интеллектуальной работы нового поколения.