Перейти к содержимому
PC Review.kz

PC Review.kz

Интересные обзоры и тесты видеокарт, процессоров, ноутбуков и комплектующих. Бенчмарки, сравнения, советы по выбору ПК в Казахстане.

Реклама ноутбука ASUS ROG Zephyrus Duo 2026
Основное меню
  • НОВОСТИ
    • Новости Software
    • Новости Hardware
  • ОБЗОРЫ
    • Ноутбуки
    • Процессоры
    • Материнские платы
    • Видеокарты
    • Водяное охлаждение
    • Оперативная память
    • Накопители
    • Блоки питания
    • Корпуса
    • Звуковые карты
    • Кулера
    • Периферия
    • Сетевые устройства
  • ЭКСПЕРИМЕНТЫ
  • РЕДАКЦИЯ
  • Переключатель языка
Кнопка: светлая/темная
Подписка
  • Главная
  • Новости
  • NVIDIA делает MoE-модели практичными: архитектура GB200 NVL72 снимает ключевые ограничения масштабирования
  • Новости
  • Новости Hardware
  • Новости Software

NVIDIA делает MoE-модели практичными: архитектура GB200 NVL72 снимает ключевые ограничения масштабирования

Александр Перевозчиков 03.12.2025 1 минуты чтение
qoBXG6ZECKDFrQAF

Архитектура Mixture-of-Experts за последние два года стала фундаментом для самых продвинутых ИИ-систем, и сегодня именно она определяет развитие моделей фронтир-класса. Подобно тому как человеческий мозг включает лишь нужные области, MoE-модели активируют только релевантные «эксперты» для каждого токена, снижая вычислительную нагрузку и повышая эффективность. Этим подходом уже пользуются все сильнейшие open-source модели на рейтинге Artificial Analysis — от DeepSeek-R1 и Kimi K2 Thinking до gpt-oss-120B и Mistral Large 3. Однако высокая сложность эксплуатации и масштабирования MoE долго оставалась серьёзным барьером для разработчиков, которым приходилось сталкиваться с ограничениями памяти, высоким давлением на пропускную способность и ростом сетевых задержек при параллельной работе экспертов.

NVIDIA заявляет, что решила эту проблему радикально: архитектура GB200 NVL72, объединяющая 72 Blackwell-GPU в единое вычислительное пространство с 1,4 экзафлопса производительности и 30 ТБ быстрой общей памяти, позволяет MoE-моделям работать на принципиально новом уровне. Система построена на масштабной NVLink-фабрике с пропускной способностью 130 ТБ/с, что обеспечивает мгновенную коммуникацию между всеми GPU и снимает ключевые ограничения, присущие платформам класса H200. По данным компании, MoE-модель Kimi K2 Thinking получает десятикратный прирост скорости по сравнению с работой на HGX H200, а аналогичные скачки наблюдаются и у DeepSeek-R1, и у Mistral Large 3.

Главный эффект нового подхода — перераспределение экспертов между 72 ускорителями, что уменьшает нагрузку на память каждого GPU и повышает пропускную способность при работе с большим количеством пользователей и длинными контекстами. NVLink Switch также принимает участие в вычислениях, ускоряя агрегацию данных от разных экспертов. Этот аппаратный фундамент дополняют программные оптимизации: NVFP4 обеспечивает высокую точность при меньшем энергопотреблении, а платформа Dynamo разделяет предзаполнение и декодирование между разными группами GPU, что позволяет наиболее эффективно распределять ресурсы внутри модели. Поддержка этих технологий уже реализована в TensorRT-LLM, SGLang и vLLM, а сама NVL72 внедряется в инфраструктуру крупнейших облачных провайдеров, включая AWS, Google Cloud, CoreWeave, Lambda и Microsoft Azure.

Разработчики уверены, что именно MoE станет стандартом для ИИ-систем следующего поколения. Представители Mistral AI отмечают, что этот подход обеспечивает высокую производительность при заметно меньшем расходе энергии, а компании вроде DeepL и CoreWeave уже используют NVL72 для обучения и развертывания новых моделей. Сочетание аппаратной плотности, скоростной связи и оптимизированного софта делает MoE не только более быстрыми, но и экономичными — а значит, ещё более привлекательными для массового внедрения.

Полную публикацию NVIDIA с дополнительными материалами можно найти на официальном сайте компании.

Об авторе

Александр Перевозчиков

Editor

Просмотреть все записи

Навигация записи

Предыдущий ASUS приостанавливает выпуск юбилейной видеокарты ROG Matrix Platinum RTX 5090 из-за обнаруженного дефекта
Следующий: Micron уходит с потребительского рынка: бренд Crucial прекращает продажи SSD и модулей памяти
Сайт производителя блоков питания Raijintek серии CRATOS
ASUS ROG Zephyrus Duo 2026: новый уровень производительности. Подробнее на официальном сайте

Популярные записи

  • SilverStone представила корпус Lucid 05 — увеличенную версию Lucid 04 с поддержкой ATX и акцентом на стеклянный дизайн
  • Прощайте, лишние приложения: MSI выводит управление RGB-подсветкой в браузер
  • Overclockers UK представила TechForge REVAlution — флагманский игровой ПК с Ryzen 7 9850X3D и Radeon RX 9070 XT REVA Edition
  • Scythe представила доступный двухбашенный кулер Magoroku с поддержкой современных платформ
  • ASUS выпустила пресс-релиз относительно производственного дефекта ROG Maximus Z690 Hero

PC Review.kz

PC Reviews – новое издание, с материалами освещающими новинки из мира ПК. На страницах сайта вы найдете множество интересных и полезных материалов не только о ПК, но и о многих других устройствах, приложениях, технологиях.

Мы стараемся публиковать качественные материалы, с подробными тестами, качественными фотографиями и полезными советами. На страницах нашего ресурса вы найдете обзоры не только компонентов ПК, например видеокарт, материнских плат, процессоров или блоков питания, но и распаковки ноутбуков, моноблоков и смартфонов.

Мы не забываем и про новости, каждый день публикуя на сайте множество материалов, которые не просто проинформируют Вас о выходе той или иной новинки, но и позволят «успеть» к распродаже в сети магазинов или проинформируют о том, на что не нужно обращать даже внимания.

До встречи на страницах нашего издания!
С уважением, команда PC Review.kz.

Мы ВКонтакте

Авторское право © 2026 Все права зарезервированы. | ReviewNews от AF themes.