Компания Intel анонсировала новые процессоры с быстрой памятью HBM (high-bandwidth memory), предназначенные для организации высокопроизводительных вычислений, построения суперкомпьютеров и систем искусственного интеллекта.
Новые продукты входят в состав семейств Xeon CPU Max и GPU Max. Чипы базируются на уже существующих технологиях центрального процессора Xeon Scalable 4-го поколения (Sapphire Rapids) и графического процессора Ponte Vecchio – версии графической технологии Intel Xe для ЦОД.
Разница состоит в том, что оба чипа поставляются с памятью HBM на процессорном кристалле и не нуждаются в стандартной памяти DRAM. Память HBM работает значительно быстрее, чем DDR4 или DDR5, и размещается на процессорной матрице рядом с ядром с высокоскоростным соединением. В отличие от памяти DDR в виде модулей она не выпускается.
«С первого взгляда на общие задачи в области высокопроизводительных вычислений и искусственного интеллекта, мы видим, насколько велико их разнообразие, — подчеркнули в Intel. – Традиционно на вершину пути ведут два маршрута. Один связан с центральными процессорами, а другой с графическими, и на каждом из них встречаются свои препятствия. Наша же цель заключается в том, чтобы двигаться вперед и решать все вопросы в комплексе».
Основное внимание разработчики CPU Max и GPU Max уделяли максимизации пропускной способности и вычислительной мощности, а также расширению возможностей, предлагаемых для решения широкого спектра задач.
Процессоры CPU Max поставляются для трех серверных конфигураций. Первая из них модулей DRAM не имеет, поэтому единственной памятью в системе будет память HBM объемом 64 Гбайт на чипе CPU Max. Именно так работает японский суперкомпьютер Fugaku, который в течение некоторого времени оставался одним из самых быстрых суперкомпьютеров в мире. В системе с двумя сокетами объем памяти увеличивается до 128 Гбайт, чего, по словам представителей Intel, «вполне достаточно для многих приложений и рабочих нагрузок». В этом сценарии приложения могут запускаться в неизменном виде.
Вторая конфигурация носит название HBM Flat Mode и сочетает HBM в процессорном корпусе со стандартными модулями DDR5. Программное обеспечение в этом случае требует оптимизации для перемещения данных между различными областями памяти.
Третья конфигурация называется HBM Caching Mode. Здесь HBM выполняет роль кэш-буфера для системной памяти DDR. Изменять программный код в этом режиме не требуется. «Возможно, вам захочется выполнить определенную настройку, чтобы оптимизировать использование имеющейся кэш-памяти очень большого объема, но даже и без этого выгода вполне очевидна», – пояснили специалисты Intel.
Процессоры GPU Max также поставляются в трех конфигурациях: 1100, 1350 и 1550. Модель 1100 представляет собой 300-ваттную плату PCIe двойной ширины с 56 ядрами Xe и 48 Гбайт памяти HBM2e. Через мосты Intel Xe Link можно подключить сразу несколько плат.
В двух других конфигурациях используется модуль OAM-ускорителя Open Compute Project (OCP) – более быстрый альтернативный интерфейс для плат PCIe.
Модель 1350 представляет собой 450-ваттный модуль OAM со 112 ядрами Xe и 96 Гбайт оперативной памяти. Модель 1550 – это 600-ваттный модуль OAM со 128 ядрами Xe и 128 Гбайт оперативной памяти.
Плата PCI Express отлично подходит для стандартных серверных систем и рабочих станций, но модули OAM ориентированы на среды с более высокой плотностью. У Intel есть ряд системных проектов, разрабатываемых OEM-производителями и поставщиками системных решений, которые будут выпускать серверы с OAM, начиная с 2023 года.
Компания Intel проектирует для Аргоннской национальной лаборатории суперкомпьютер с процессорами CPU Max и GPU Max. Его производительность после запуска в эксплуатацию в 2023 году превысит 2 эксафлопса, что в два раза больше, чем у Frontier, нынешнего лидера в гонке суперкомпьютеров. По словам представителей Intel, это стало возможным благодаря сочетанию процессоров двух типов.
«Кто-то, наверное, возразит, что вся нагрузка приходится на графические процессоры, а центральный процессор самого высокого класса, здесь, в общем-то, и не нужен, – заметили в Intel. – И память HBM тоже не нужна. Но это неверно. Благодаря интегрированной в центральный процессор памяти HBM можно добиться значительного роста производительности, поскольку на центральном процессоре выполняется еще достаточно много программного кода даже при переносе основной нагрузки на графическую плату».
Новые процессоры уже были отгружены ряду первых клиентов, в том числе и в Аргоннскую национальную лабораторию. Начало полномасштабного выпуска представителей семейства Max намечено на январь 2023 года.