Перейти к содержимому
PC Review.kz

PC Review.kz

Интересные обзоры и тесты видеокарт, процессоров, ноутбуков и комплектующих. Бенчмарки, сравнения, советы по выбору ПК в Казахстане.

Реклама ноутбука ASUS ROG Zephyrus Duo 2026
Основное меню
  • НОВОСТИ
    • Новости Software
    • Новости Hardware
  • ОБЗОРЫ
    • Ноутбуки
    • Процессоры
    • Материнские платы
    • Видеокарты
    • Водяное охлаждение
    • Оперативная память
    • Накопители
    • Блоки питания
    • Корпуса
    • Звуковые карты
    • Кулера
    • Периферия
    • Сетевые устройства
  • ЭКСПЕРИМЕНТЫ
  • РЕДАКЦИЯ
  • Переключатель языка
Кнопка: светлая/темная
Подписка
  • Главная
  • Новости
  • NVIDIA Blackwell Ultra снижает стоимость ИИ-инференса до 35 раз и ускоряет агентные ИИ-системы
  • Новости
  • Новости Hardware
  • Новости Software

NVIDIA Blackwell Ultra снижает стоимость ИИ-инференса до 35 раз и ускоряет агентные ИИ-системы

Александр Перевозчиков 23.02.2026 (Последнее обновление: 23.02.2026) 1 минуты чтение
F3vTkirpDm0cJjJl

Платформа NVIDIA Blackwell, уже широко используемая крупными провайдерами инференса, получила развитие в виде Blackwell Ultra и нацелена на новый этап эволюции агентного ИИ. По данным отчёта OpenRouter State of Inference, за последний год доля запросов, связанных с программированием и автоматизированной разработкой кода, выросла с 11% почти до 50%. Такие нагрузки требуют не только высокой пропускной способности, но и минимальной задержки, особенно при работе с длинным контекстом и многошаговыми цепочками рассуждений.

Новые данные SemiAnalysis InferenceX показывают, что сочетание глубокой оптимизации программного стека и аппаратных возможностей Blackwell Ultra даёт резкий скачок эффективности. Системы NVIDIA GB300 NVL72 демонстрируют до 50 раз более высокую производительность на мегаватт по сравнению с платформой Hopper, что в реальных сценариях приводит к снижению стоимости обработки токенов до 35 раз. Такой результат достигнут за счёт комплексного подхода к проектированию — от архитектуры чипов и системного уровня до библиотек и инструментов инференса.

Ранее исследования Signal65 уже фиксировали, что GB200 NVL72 обеспечивала более чем десятикратный прирост токенов на ватт относительно Hopper. Однако Blackwell Ultra развивает этот эффект, особенно в задачах с низкой задержкой, где работают агентные ИИ-приложения и интерактивные помощники для программирования. Постоянные улучшения в NVIDIA TensorRT-LLM, Dynamo, Mooncake и SGLang позволяют существенно повышать пропускную способность при инференсе моделей с архитектурой mixture-of-experts, а оптимизированные GPU-ядра, NVLink Symmetric Memory и более эффективное управление запуском вычислений минимизируют простои и задержки.

Наиболее заметное преимущество GB300 NVL72 проявляется при работе с длинным контекстом. В сценариях, где модель обрабатывает входы объёмом до 128 тысяч токенов и формирует длинные ответы, система обеспечивает до полуторакратного снижения стоимости токена по сравнению с GB200. Это стало возможным благодаря более высокой вычислительной производительности в формате NVFP4 и ускоренной обработке механизма внимания, что критично для анализа крупных кодовых баз целиком.

Инфраструктура на базе GB300 NVL72 уже внедряется в промышленную эксплуатацию. Такие компании, как Microsoft, CoreWeave и Oracle Cloud Infrastructure, используют эти системы для задач агентного программирования и интерактивных ассистентов, где каждая миллисекунда задержки напрямую влияет на пользовательский опыт и совокупную стоимость вычислений.

В NVIDIA подчёркивают, что по мере смещения фокуса индустрии в сторону инференса эффективность работы с длинным контекстом и экономика токенов становятся ключевыми факторами. При этом компания уже смотрит дальше: следующая платформа Vera Rubin NVL72 должна обеспечить ещё один скачок производительности, предлагая до десятикратного прироста пропускной способности на мегаватт по сравнению с Blackwell и позволяя обучать крупные модели MoE с существенно меньшим числом GPU.

Об авторе

Александр Перевозчиков

Editor

Просмотреть все записи

Навигация записи

Предыдущий GXTrust представила новые игровые мыши Felox+: ставка на точность и доступность
Следующий: В Японии резко подорожал ASUS ROG Xbox Ally X — возможный сигнал для западных рынков
Сайт производителя блоков питания Raijintek серии CRATOS
ASUS ROG Zephyrus Duo 2026: новый уровень производительности. Подробнее на официальном сайте

Популярные записи

  • NVIDIA и Meta объявили о стратегическом партнёрстве для развития ИИ-инфраструктуры нового поколения
  • Секретное оружие XFX: Как память от Samsung делает видеокарты тише и эффективнее
  • CannonKeys представила Wood Bakeneko65 — кастомную механическую клавиатуру из дерева за $380
  • ASUS и GoPro объединились, чтобы революционизировать 360-видео: представлено ИИ-приложение StoryCube
  • Монитор из будущего: MSI представила QD-OLED дисплей с ИИ и частотой 500 Гц

PC Review.kz

PC Reviews – новое издание, с материалами освещающими новинки из мира ПК. На страницах сайта вы найдете множество интересных и полезных материалов не только о ПК, но и о многих других устройствах, приложениях, технологиях.

Мы стараемся публиковать качественные материалы, с подробными тестами, качественными фотографиями и полезными советами. На страницах нашего ресурса вы найдете обзоры не только компонентов ПК, например видеокарт, материнских плат, процессоров или блоков питания, но и распаковки ноутбуков, моноблоков и смартфонов.

Мы не забываем и про новости, каждый день публикуя на сайте множество материалов, которые не просто проинформируют Вас о выходе той или иной новинки, но и позволят «успеть» к распродаже в сети магазинов или проинформируют о том, на что не нужно обращать даже внимания.

До встречи на страницах нашего издания!
С уважением, команда PC Review.kz.

Мы ВКонтакте

Авторское право © 2026 Все права зарезервированы. | ReviewNews от AF themes.