На конференции Nvidia GTC 2024 была представлена архитектура GPU нового поколения Blackwell. Компания предложит три GPU для ЦОДов и задач искусственного интеллекта — B100, B200 и GB200. Последний, наиболее мощный, будет состоять из двух GPU и центрального процессора Grace. Новая архитектура, подобно GPU компании AMD, предполагает использование блоков («чиплетов») — процессоры состоят из двух больших кристаллов, связанных интерфейсом на 10 Тбайт/с. Как заявляют в Nvidia, у GB200 будет в семь раз более высокая производительность инференса, вчетверо более высокая производительность обучения и в 25 раз меньше энергопотребление, чем у его предшественника GH200, основанного на архитектуре Hopper. Как подсчитали в компании, благодаря высоким характеристикам энергоэффективности масштаб систем ИИ в ЦОДах можно будет увеличить, оснастив их более чем 100 тыс. GPU.
В Nvidia рассказали о «трансформаторном движке» (transformer engine) второго поколения в Blackwell, который следит за характеристиками работы нейронной сети и автоматически выбирает для каждого ее слоя математическую точность весовых коэффициентов. В Blackwell она варьируется от FP4 (4 знака после запятой) до FP64 (64 знака) с шагом по степеням двойки. Чем больше точность, тем ниже производительность и выше расход энергии. В Nvidia сообщили, что производительность FP8 у Blackwell составляет 4 PFLOPS — вдвое больше, чем у Hopper. Blackwell поддерживает интерфейс NVLink пятого поколения, который обеспечивает в 18 раз более высокую пропускную способность по сравнению с предыдущим, позволяя обрабатывать на многоузловых системах модели ИИ с триллионами параметров.