NVIDIA выпускает компактные AI-модели для локального использования: от 1,5 до 32 млрд параметров

NVIDIA выпускает компактные AI-модели для локального использования: от 1,5 до 32 млрд параметров

Геймеры и разработчики получают мощные инструменты для экспериментов с ИИ — без облачных вычислений и гигантских GPU.
NVIDIA продолжает демократизировать искусственный интеллект, представив линейку OpenReasoning-Nemotron — четыре компактные модели для логических вычислений с 1,5, 7, 14 и 32 миллиардами параметров. Все они созданы на основе огромной DeepSeek R1 0528 (671 млрд параметров), но благодаря сжатию и оптимизации теперь работают даже на игровых ПК без необходимости аренды дорогих облачных серверов.
Как NVIDIA ужала гигантскую модель до разумных размеров?
Вместо сложных алгоритмов сжатия инженеры NVIDIA пошли простым, но эффективным путём: обучили модели на 5 миллионах примеров — задач по математике, естественным наукам и программированию. Метод supervised learning (обучение с учителем) позволил добиться высокой точности без использования ресурсоёмкого reinforcement learning (обучения с подкреплением).
Результаты впечатляют:
32-миллиардная модель набрала 89,2 балла в тесте AIME24 и 73,8 в конкурсе HMMT February.
Даже 1,5-миллиардная версия показала достойные 55,5 и 31,5 балла — уровень, достаточный для многих практических задач.
Зачем это геймерам и энтузиастам?
Локальный ИИ без облачных затрат. Теперь можно экспериментировать с генерацией кода, решением сложных задач или даже созданием собственных чат-ботов прямо на домашнем ПК — если у вас, конечно, есть мощная видеокарта (например, RTX 4090 справится с 32B-моделью).
GenSelect — режим для максимальной точности. Модель может генерировать несколько ответов на один вопрос и выбирать лучший, что повышает качество решений. В некоторых тестах 32B-версия даже обгоняет OpenAI o3-high!
Чистая база для кастомизации. Поскольку NVIDIA не использовала reinforcement learning, сообщество получило идеальную основу для дальнейших экспериментов — например, можно дообучить модель под свои нужды.
Где взять и что дальше?
Все четыре модели уже доступны на Hugging Face, так что любой желающий может скачать их и начать тестирование. Для исследователей это отправная точка в разработке новых методов обучения ИИ, а для обычных пользователей — шанс запустить продвинутый ИИ у себя дома.
Вывод: NVIDIA делает ещё один шаг к тому, чтобы сложные AI-технологии стали ближе к массовому пользователю. Теперь даже без доступа к суперкомпьютерам можно работать с мощными языковыми моделями — главное, чтобы видеокарта тянула!
А у вас есть железо для таких экспериментов?