Intel объявила об изменении стратегии, которое повлияет на ее планы разработки XPU и продуктов для ЦОДов.
XPU – это попытка Intel объединить несколько электронных компонентов в одном корпусе. Разработанный ранее план заключался в том, чтобы интегрировать центральный и графический процессоры, сетевые компоненты, программируемые логические матрицы (FPGA) и ускорители искусственного интеллекта, после чего использовать программное обеспечение для выбора наилучшего компонента для решения конкретной задачи.
Проект был весьма амбициозным, и, похоже, в Intel признают, что не в состоянии его реализовать, по крайней мере, в нынешних условиях.
Вице-президент и генеральный менеджер подразделения Intel Super Compute Group Джефф Маквей представил обновленный план создания процессоров для ЦОДов, предусматривающий отказ от претворения в жизнь части намеченных инициатив. Теперь от комбинации центрального и графического процессоров, проектировавшейся под кодовым наименованием Falcon Shores, останется только ее графическая составляющая.
«За последние 12 месяцев многое изменилось, – признал Маквей в ходе брифинга на конференции ISC High Performance Conference в Гамбурге. – Генеративный искусственный интеллект вносит свои коррективы во все. И сегодня мы считаем преждевременным интегрировать центральный и графический процессоры в единый продукт следующего поколения».
Прежний план предусматривал, что центральный и графический процессоры будут проектироваться в одном цикле, но разработка графического процессора может занять больше времени, а значит, технология центрального процессора на протяжении всего этого периода окажется замороженной. В Intel пришли к выводу, что динамичный характер современного рынка диктует необходимость дискретных решений.
«Я признаю, что был неправ, – добавил Маквей. – Мы продвигались по пути XPU слишком быстро. Нам кажется, что гибкость на уровне платформы будет лучше соответствовать этой динамичной природе. А когда придет время, мы все интегрируем».
Действительно, в планах Intel произошли существенные изменения.
В марте компания отказалась от суперкомпьютерного графического процессора, который разрабатывался под кодовым наименованием Rialto Bridge и должен был прийти на смену уже существующему графическому процессору серии Max с кодовым наименованием Ponte Vecchio.
Новый чип Falcon Shores, намеченный теперь на роль преемника Ponte Vecchio, представляет собой дискретный графический процессор следующего поколения, предназначенный как для высокопроизводительных вычислений, так и для искусственного интеллекта. Он объединит процессоры искусственного интеллекта, стандартную коммутацию Ethernet, память HBM3 и масштабируемую подсистему ввода-вывода. Выпуск его намечен на 2025 год.
В дальнейшем в Intel не исключают возможности объединения центрального и графического процессоров, но сейчас это не является приоритетом.
Представлен ряд улучшений Intel oneAPI – семейства компиляторов, библиотек и инструментов программирования, которые позволяют создавать код для Xeon, графического процессора Falcon Shores и процессора искусственного интеллекта Gaudi. Достаточно написать программный код один раз, и API самостоятельно выберет лучший чип для его выполнения. Последнее обновление обеспечивает увеличение скорости приложений для высокопроизводительных вычислений благодаря разгрузке графического процессора OpenMP, расширенной поддержке OpenMP и Fortran, а также ускорению систем искусственного интеллекта и глубокого обучения.
На суперкомпьютерном фронте Intel уже поставила более 10 624 вычислительных узлов с чипами Xeon Max и памятью HBM для системы Aurora, объединяющей 21 248 процессорных узлов, 63 744 графических процессора, оперативную память DDR емкостью 10,9 Пбайт и хранилище объемом 230 Пбайт. Строительство суперкомпьютера Aurora, производительность которого превысит 2 эксафлопса, ведется в Национальной лаборатории им. Лоуренса в Ливерморе. Ожидается, что после ввода в эксплуатацию он лишит Frontier звания самого быстрого суперкомпьютера в мире.
В Intel рассказали также о серверах Supermicro, нацеленных на использование систем искусственного интеллекта Nvidia DGX. Они оснащены восемью графическими процессорами Ponte Vecchio Max, на каждый из которых приходится 128 Гбайт памяти HBM. Таким образом, общий объем памяти системы превышает 1 Тбайт. В соответствии со своим предназначением серверы должны будут обслуживать приложения искусственного интеллекта. Ожидается, что в широкую продажу они поступят в третьем квартале текущего года.