KunPeng 930: Huawei бросает вызов Intel и AMD с новым процессором для центров обработки данных

KunPeng 930: Huawei бросает вызов Intel и AMD с новым процессором для центров обработки данных

В мире технологий появился новый игрок на поле серверных процессоров. Компания Huawei представила свой новейший чип для центров обработки данных — KunPeng 930. Благодаря анализу и разборке, проведенным ютубером Kurnal, мы получили уникальную возможность заглянуть внутрь этого монстра и понять, как он устроен.

KunPeng 930 — это настоящий гигант размером примерно 77,5 на 58 мм. Его архитектура представляет собой гибрид, сочетающий в себе передовые технологии и проверенные временем решения. Сердцем процессора являются вычислительные чиплеты, произведенные на 5-нм техпроцессе компании TSMC. А вот массивный чип ввода-вывода (I/O) создан на мощностях SMIC по более зрелому, вероятно, 14-нм техпроцессу. Такой подход позволяет Huawei сосредоточить все усилия на повышении плотности транзисторов и масштабировании ядер там, где это критически важно, в то время как чип ввода-вывода можно производить в больших объемах, что снимает нагрузку с цепочек поставок.

Каждый вычислительный чиплет содержит сорок ядер Taishan, основанных на архитектуре Arm. Платформа позволяет объединять два таких чиплета, создавая процессор с впечатляющим количеством — 80 ядер. При этом чип ввода-вывода обеспечивает широчайшие возможности для подключения, о чем свидетельствует наличие 96 линий PCIe, видимых на фотографиях платы.

Особое внимание в KunPeng 930 уделено кэш-памяти и контроллерам памяти. Каждый вычислительный чиплет оснащён парой приватных кэшей L2 по 2 МБ на ядро. Кроме того, на том же кристалле размещено примерно 91 МБ общей кэш-памяти L3, что является значительным улучшением по сравнению с предыдущим поколением. Контроллеры памяти DDR5 также интегрированы в вычислительные чиплеты, и, согласно диаграммам Huawei, на каждый чиплет приходится по 12 каналов, что в сумме даёт 24 канала на процессор. Однако, на сфотографированной плате можно увидеть только 16 слотов DIMM, что говорит о компромиссах в разводке и стоимости.

Хотя процессор заявляет поддержку 96 линий PCIe, на плате доступно около 80, что также связано с оптимизацией разводки и затратами. Использование чипа ввода-вывода от SMIC, безусловно, облегчает массовое производство, но требует тщательной оптимизации микропрограммного обеспечения и драйверов для достижения максимальной производительности. Поэтому пока нам остаётся лишь ждать результатов в серверных бенчмарках, чтобы оценить реальную мощь KunPeng 930.