Суперкомпьютер Frontier занимает на сегодняшний день первое место в рейтинге Top500, но в Национальной лаборатории минэнерго США в Окридже, где он установлен, не собираются останавливаться на достигнутом. Уже опубликован запрос на выдачу предложений по новой машине OLCF-6. Система, получившая название Discovery, должна быть поставлена в конце 2027-го или в начале 2028 года. Документ с техническими требованиями к ней занимает 69 страниц. Предполагается, что в течение какого-то времени две машины будут работать одновременно, пока весь программный код не будет перенесен на новый компьютер. Бюджет проекта составляет 500 млн долл.
Суперкомпьютер Frontier, развернутый в 2021 году, – это нечто грандиозное. Машина HPE Cray EX размещается в 74 стойках HPE Olympus с высокоскоростным интерфейсом Slingshot-11. Она потребляет 22 786 кВт и оснащена 9408 вычислительными узлами AMD с 8 699 904 процессорными ядрами. Каждый узел имеет доступ к 512 Гбайт оперативной памяти DDR4.
Система Discovery должна стать еще лучше, с тем чтобы эффективно решать все возложенные на нее задачи – от относительно небольших рабочих нагрузок, использующих лишь 20% узлов, до тех, которым требуется вся имеющаяся вычислительная мощность целиком. Систему предполагается сделать расширяемой за поддержки экспериментальных функций и взаимодействия с другими объектами ORNL Leadership Computing Facility (OLCF). Ее ввод в эксплуатацию должен состояться до окончания срока службы Frontier, не выходя при этом за рамки операционного бюджета OLCF. Необходимо обеспечить продуктивную программную среду для пользователей и повысить эффективность энергопотребления всей экосистемы в целом. Нельзя забывать, конечно, и об интеграции технологий искусственного интеллекта, призванных ускорить совершение очередных открытий в области энергетики и решение актуальных вопросов национальной безопасности.
В настоящее время рассматривается самый широкий спектр различных вариантов использования суперкомпьютера – от обратного проектирования и управления сложными системами, в том числе энергосистемами и ядерными реакторами, до генеративного искусственного интеллекта и обслуживания основополагающих моделей обработки неструктурированных данных, текста и изображений высокого разрешения, поступающих из различных источников. Организация процессов с использованием ИИ предъявляет новые требования к системной архитектуре, требуя увеличения пропускной способности межсетевых соединений и оптимизации подсистем хранения, способных выполнять операции ввода-вывода с произвольным доступом на очень высоких скоростях.
OLCF предлагает ряд тестовых примеров, результаты выполнения которых должны быть представлены в заявках. На соответствующем сайте опубликованы также результаты, продемонстрированные существующими суперкомпьютерами, включая Frontier. В запросе предложений содержится подробное описание необходимого программного обеспечения, включая операционную систему и системы управления рабочей нагрузкой, а также платформу разработки, поддерживающую Си C++, Python и Фортран. Все это относится к числу высокоприоритетных технических требований. Ожидается, что поставщики предоставят оценки затрат на техническое обслуживание как аппаратного, так и программного обеспечения. И, конечно, система должна обладать высоким уровнем защиты.