Стремясь не отстать в гонке искусственного интеллекта от Nvidia, компания AMD представила новый процессор Instinct, который способен выполнять работу сразу нескольких графических процессоров.
Генеральный директор AMD Лиза Су назвала модель Instinct MI300X «самой сложной вещью, которая когда-либо была создана компанией».
Процессор MI300X, вмещающий в себя 146 млрд транзисторов, поставляется с высокоскоростной памятью HBM3 объемом 192 Гбайт, которая совместно используется центральным и графическим процессорами. На плате расположено в общей сложности 13 чиплетов. Пропускная способность памяти составляет 5,2 Тбайт/с, что на 60% быстрее, чем у Nvidia H100.
В чипе присутствуют процессорные ядра Zen и ядра графического процессора архитектуры нового поколения CDNA 3. Огромный объем памяти становится дополнительным преимуществом.
Объемы и сложность моделей заметно увеличиваются, подчеркнула Су. Для работы с большими языковыми моделями нужно иметь сразу несколько графических процессоров. MI300X позволяет сократить потребность в дополнительных графических процессорах, что приобретает все более важное значение по мере дальнейшего роста моделей.
По собственным оценкам AMD, MI300X в восемь раз мощнее существующего процессора MI250X (на базе которого создан самый быстрый на сегодняшний день в мире суперкомпьютер Frontier) и в пять раз опережает его по эффективности энергопотребления. Новый процессор будет использоваться в системе El Capitan, развертывание которой планируется завершить в следующем году в Национальной лаборатории им. Лоуренса в Ливерморе. Ее производительность превысит 2 эксафлопса.
В ходе конференции Су представила также AMD Instinct – референсную серверную платформу, соответствующую спецификациям Open Compute Project. Восемь графических процессоров MI300X предназначены для обучения систем генеративного искусственного интеллекта и выполнения приложений логического вывода.
Корпоративные заказчики и гиперскейлеры могут использовать платформу Instinct для установки графических процессоров MI300X в существующие серверные стойки OCP.
В AMD рассказали также о процессоре четвертого поколения EPYC 97X4, разрабатывавшемся под кодовым наименованием Bergamo. Этот процессор специально проектировался для облачных сред и оснащен большим количеством ядер для запуска виртуальных машин. В общей сложности Bergamo имеет 128 ядер с поддержкой гиперпоточности. Таким образом, в системе с двумя сокетами может насчитываться до 512 виртуальных процессоров.
По своей конструкции новые процессоры отличаются от элементной базы, предназначенной для организации вычислений общего назначения – продукты Bergamo меньше по размеру и в значительной степени ориентированы на пропускную способность, отсюда и их многоядерная структура.
Bergamo использует все особенности платформенной инфраструктуры, которую были разработали для Genoa, подчеркнула Су; поддерживается та же память следующего поколения и те же возможности ввода-вывода. Подобный подход позволяет компании увеличить число ядер на сокет до 128 и выйти на лидирующие позиции с точки зрения производительности и эффективности энергопотребления в облаке, уверены в AMD.
Опытные образцы MI300X и Bergamo будут доступны в третьем квартале.