Mistral AI представила семейство Mistral 3 — масштабируемые MoE-модели нового поколения с оптимизацией под NVIDIA

Компания Mistral AI официально представила линейку Mistral 3 — открытые многомодальные и многоязычные модели, созданные для максимальной эффективности на суперкомпьютерных системах и edge-платформах NVIDIA. Ключевым элементом обновления стала Mistral Large 3, построенная на архитектуре mixture-of-experts, которая активирует только наиболее значимые блоки модели для каждого токена. Такой подход повышает производительность без избыточных вычислений и делает масштабируемый корпоративный ИИ не просто достижимым, а практичным и экономичным. Новые модели станут доступны на всех уровнях — от облака и дата-центров до локальных устройств — начиная с 2 декабря.

Флагманская Mistral Large 3 предлагает 41 млрд активных параметров при 675 млрд итоговых параметров и поддерживает контекст объёмом 256 тысяч токенов. Она ориентирована на корпоративные ИИ-нагрузки, которым требуется высокая точность, адаптируемость и предсказуемая масштабируемость. При сочетании с системами NVIDIA GB200 NVL72 и оптимизациями Mistral AI, модель демонстрирует полную реализацию преимуществ экспертного параллелизма, используя когерентность памяти NVLink и расширенные методы распределения экспертов. Эти возможности усиливаются низкоточным форматом вычислений NVFP4 и оптимизациями NVIDIA Dynamo, что обеспечивает высокую эффективность как при обучении, так и при инференсе. По данным компании, на платформе GB200 NVL72 Mistral Large 3 показала десятикратный прирост производительности по сравнению с предыдущим поколением GPU NVIDIA H200, что улучшает пользовательский опыт, снижает стоимость генерации токена и повышает энергоэффективность.

Помимо флагмана, Mistral AI представила девять компактных моделей Ministral 3, ориентированных на работу «на краю» — от решений NVIDIA Spark и ПК на базе RTX до устройств Jetson. Эти модели учитывают потребности разработчиков, которым важно запускать локальный ИИ с минимальными задержками и без необходимости в облачных ресурсах. NVIDIA совместно с сообществом оптимизировала работу Ministral 3 в Llama.cpp и Ollama, что уже сейчас позволяет энтузиастам протестировать быстрый и эффективный ИИ на потребительских GPU.

Анонс Mistral 3 подводит отрасль к новой фазе, которую компания называет эпохой распределённого интеллекта, где передовые исследования и реальные сценарии применения сливаются в единую экосистему гибких, масштабируемых и доступных ИИ-моделей.