В условиях глобальной гонки за ИИ-превосходством, где доминируют Китай и США, постоянно растет потребность в вычислительной мощности, способной обрабатывать модели с триллионами параметров. В то время как текущий ChatGPT-4 оперирует примерно 1.8 триллионами параметров, а человеческий мозг насчитывает около 150 триллионов синапсов, будущие системы должны будут обрабатывать более $10^{20}$ параметров. Сегодня такие амбиции выглядят астрономически дорогими: традиционные решения для обучения моделей такого масштаба могут стоить более $8 триллионов и потреблять свыше 276 гигаватт энергии.
На этом фоне компания Tachyum совершила настоящую революцию, анонсировав ключевые детали и спецификации своего универсального процессора Prodigy, выполненного по 2-нанометровому техпроцессу.
Превосходство Над Флагманами NVIDIA
Prodigy, который Tachyum называет первым в истории чипом, способным превысить 1000 PFLOPs на инференсе (для сравнения, заявленная производительность NVIDIA Rubin составляет 50 PFLOPs), выходит на рынок с заявкой на доминирование.
В своих максимальных конфигурациях Prodigy Ultimate показывает в 21.3 раза более высокую производительность ИИ на стойку, чем конкурирующий NVIDIA Rubin Ultra NVL576. Еще более впечатляющие результаты демонстрирует Prodigy Premium, обеспечивающий до 25.8 раза более высокую производительность ИИ, чем Vera Rubin 144. Полные технические спецификации, подтверждающие эти цифры, будут опубликованы в течение недели.
Революция Стоимости и Энергоэффективности
Прорыв Tachyum заключается не только в скорости, но и в экономической доступности. Решение на базе Prodigy, способное обучать модели сопоставимого масштаба, что и вышеупомянутые триллионные системы, оценивается всего в $78 миллиардов, при этом требуя лишь 1 гигаватт мощности. Это делает его доступным для множества компаний и даже целых стран, кардинально меняя экономику масштабного ИИ.
Архитектура Prodigy была серьезно обновлена и переведена на 2-нм техпроцесс, что критически важно для снижения энергопотребления, особенно с учетом того, что в один корпус будет интегрировано несколько чиплетов. Каждый чиплет Prodigy включает 256 высокопроизводительных 64-битных ядер.
Благодаря недавним инвестициям в размере $220 миллионов, 2-нм процессор Prodigy готовится к этапу производства (tape-out).
Универсальность и Открытость
Prodigy позиционируется как универсальный процессор, который устраняет необходимость в дорогих специализированных ускорителях, таких как GPU и FPGA. Он обеспечивает в 3 раза более высокую производительность по сравнению с лучшими x86-процессорами в серверных задачах и в 6 раз более высокую производительность в HPC-задачах, чем самые быстрые GPGPU.
Tachyum делает акцент на открытости: компания работает над открытием архитектуры набора инструкций (ISA), уже лицензирует свои типы данных Tachyum AI (TAI) и предлагает лицензирование ядра Tachyum Processing Unit (TPU). Кроме того, технология памяти Prodigy, использующая стандартные компоненты, позволяет в 10 раз увеличить пропускную способность памяти на базе DIMM и доступна для лицензирования.
Новинка будет представлена в нескольких конфигурациях, включая Prodigy Ultimate с 1024 высокопроизводительными ядрами и 128 линиями PCIe 7.0, а также Prodigy Premium и Entry-level варианты, обеспечивая проникновение на широкий спектр рынков — от ИИ и экзафлопсного суперкомпьютинга до облачных сервисов и баз данных. Система поддерживает запуск немодифицированных бинарных файлов Intel/AMD x86, что гарантирует клиентам готовность к работе «с первого дня».
«После долгого ожидания мы обеспечили финансирование для производства. Первый в мире Универсальный Процессор готов поступить в производство, чтобы преодолеть присущие сегодняшним центрам обработки данных ограничения», — заявил доктор Радослав Данилак, основатель и генеральный директор Tachyum. — «Prodigy Premium и Ultimate обеспечат превосходную производительность при более низкой стоимости, чем любое другое решение на рынке».
