Компания Kioxia объявила о разработке нового типа твердотельных накопителей — Super High IOPS SSD, которые позволяют графическим процессорам напрямую обращаться к высокоскоростной флеш-памяти, фактически расширяя возможности High Bandwidth Memory в системах искусственного интеллекта. Новая линейка получила название KIOXIA GP Series и ориентирована на растущие требования AI и высокопроизводительных вычислений, где критично быстрое обращение к большим объёмам данных.
Ключевая особенность разработки заключается в интеграции с инициативой NVIDIA Storage-Next от NVIDIA, которая предполагает переход от вычислительно-ориентированных нагрузок к задачам, ограниченным пропускной способностью хранения данных. В рамках этой концепции GPU получают возможность напрямую использовать флеш-память как расширение собственной памяти, преодолевая ограничения объёма HBM и повышая эффективность обработки больших датасетов.
Накопители серии GP используют фирменную память Kioxia XL-FLASH с низкой задержкой, обеспечивая существенно более высокие показатели IOPS, более тонкую гранулярность доступа к данным вплоть до 512 байт и сниженное энергопотребление на операцию ввода-вывода по сравнению с традиционными TLC SSD. Такой подход позволяет приблизить данные к вычислительным ресурсам и повысить загрузку GPU в сценариях инференса и обучения.
В компании подчёркивают, что развитие AI приводит к экспоненциальному росту требований к памяти, включая увеличение KV-кэшей и контекстных окон моделей до миллионов токенов. Это требует расширения иерархии памяти за пределы GPU. В этом контексте также представлен накопитель KIOXIA CM9 Series формата PCIe 5.0 E3.S с ёмкостью до 25,6 ТБ и высокой выносливостью, который предназначен для поддержки масштабных AI-инференс-систем и архитектур наподобие контекстной памяти.
Ожидается, что первые образцы KIOXIA GP Series будут доступны ограниченному кругу партнёров к концу 2026 года, тогда как поставки CM9 начнутся в третьем квартале. В Kioxia считают, что подобные решения станут ключевым элементом будущих AI-инфраструктур, где баланс между вычислениями и доступом к данным определяет общую производительность и экономическую эффективность.
