Hitech logo

Кейсы

NVIDIA и Amazon анонсировали Project Ceiba — облачный ИИ-суперкомпьютер

TODO:
Екатерина Смирнова29 ноября 2023 г., 11:22

NVIDIA и Amazon Web Services (AWS) представили новые совместные решения, фокусирующиеся на искусственном интеллекте. Они анонсировали мощные системы NVIDIA GH200 NVL32 для обучения и выполнения задач нейронных сетей даже с 1 трлн параметров. Это стандартные серверные стойки с 32 гибридными ускорителями GH200, позволяющие проводить операции с производительностью до 128 петафлопс. Кроме того, компании объявили о создании самого мощного облачного ИИ-суперкомпьютера в мире — Project Ceiba. Он обещает производительность в 65 эксафлопс с использованием более 16 тыс. ускорителей GH200 и колоссальным объемом памяти в 9,1 петабайта.

Самые интересные технологические и научные новости выходят в нашем телеграм-канале Хайтек+. Подпишитесь, чтобы быть в курсе.

NVIDIA GH200 NVL32 — готовая система, представленная в формате стандартной серверной стойки. Она включает в себя 32 гибридных ускорителя NVIDIA GH200 Grace Hopper Superchip. Каждый ускоритель в свою очередь является системой из центрального процессора с 72 ядрами Arm Neoverse и графического процессора NVIDIA H100. Эта стойка обеспечивает впечатляющую производительность до 128 петафлопс в операциях FP8 (квадриллион операций в секунду).

Система включает 2304 процессорных Arm-ядра, 20 Тбайт оперативной памяти вместе с 4,5 Тбайт HBM3e, обеспечивающей общую пропускную способность 157 Тбайт/с. Для связи между суперчипами GH200 используются девять коммутаторов NVSwitch и интерфейс NVLink с общей пропускной способностью вплоть до 57,6 Тбайт/с. NVIDIA GH200 NVL32 оснащен системой жидкостного охлаждения.

AWS будет первым, кто предложит системы GH200 NVL32 в составе облачной платформы NVIDIA DGX Cloud. Более того, Amazon предоставит клиентам возможность объединять новые системы NVIDIA в кластеры EC2 UltraClasters, что позволит использовать тысячи ускорителей GH200 Superchip. NVIDIA отмечает, что системы GH200 NVL32 идеально подходят для обучения и использования больших нейронных сетей, включая те, у которых 1 трлн параметров.

Компании также объявили о создании Project Ceiba — самого быстрого в мире суперкомпьютера для искусственного интеллекта на базе графических процессоров. Project Ceiba обеспечит невероятную производительность в 65 эксафлопс (FP8). Система будет включать 16 384 ускорителя GH200, а также обладать огромным объемом памяти в 9,1 петабайта и общей пропускной способностью интерконнекта на уровне 410 Тбайт/с. Суперкомпьютер будет интегрирован в облако AWS DGX Cloud и станет доступным для клиентов AWS в следующем году.