Tenstorrent сократила число вычислительных ядер в ускорителях Blackhole P150

Tenstorrent сократила число вычислительных ядер в ускорителях Blackhole P150

Компания Tenstorrent, специализирующаяся на разработке высокопроизводительных ускорителей для задач искусственного интеллекта и возглавляемая известным архитектором процессоров Джимом Келлером, внесла заметные изменения в спецификации своих ускорителей Blackhole P150. Согласно обновлённой документации, модели P150a и P150b теперь поставляются с меньшим количеством вычислительных ядер, чем заявлялось ранее. Вместо 140 ядер Tensix пользователи получают 120 активных ядер, то есть примерно на 14% меньше от первоначальных характеристик.

Официальное объяснение компании выглядит довольно расплывчато. В Tenstorrent заявляют, что обновление прошивки до версии 19.5.0 и новее меняет число ядер на всех уже выпущенных картах с целью унификации интерфейса для низкоуровневого ПО и системного софта. При этом подчёркивается, что для типичных рабочих нагрузок снижение производительности якобы не превышает 1–2% и не имеет принципиального значения. Тем не менее, пересмотр конфигурации напрямую отражается на паспортных показателях вычислительной мощности.

Ранее Blackhole P150 с 140 ядрами и 32 ГБ памяти GDDR6, рассчитанный на энергопотребление до 300 Вт и активное охлаждение в форм-факторе для рабочих станций, демонстрировал производительность до 774 терафлопс в формате BLOCKFP8. После перехода на 120 ядер этот показатель снизился до 664 терафлопс при той же разрядности. Для модели P150a, оснащённой четырьмя пассивными портами QSFP-DD 800G, изменения затрагивают те же ключевые параметры.

Причины такого шага официально не раскрываются, однако в профессиональном HPC-сообществе выдвигается несколько версий. Одна из них связана с тепловыми ограничениями: при лимите в 300 Вт 140-ядерная конфигурация могла не выходить на стабильные рабочие частоты, что мешало реализации заявленного потенциала. Другая версия указывает на вопросы выхода годных кристаллов, поскольку добиться стабильной работы 120 ядер на одном чипе значительно проще, чем всех 140, особенно на фоне планов Tenstorrent масштабировать архитектуру в сторону многочиповых решений. Наконец, часть экспертов допускает, что серийные версии ускорителей всё ещё используют кремний, близкий к экспериментальному, и сокращение числа активных блоков является вынужденной мерой на текущем этапе зрелости продукта.