В НОВЫХ Xeon Phi будут усовершенствованы межсоединения и средства работы с памятью |
Спеша приблизить эпоху экзаскалярных суперкомпьютеров, в Intel внесли доработку в чип Xeon Phi, способную оказать серьезное влияние на конструкцию систем высокопроизводительных вычислений.
Для нового чипа, имеющего кодовое наименование Knights Landing, в Intel обещают значительные улучшения в плане быстродействия и экономии энергии. По прогнозам аналитиков, выйти он должен в следующем году или в 2015-м. В новом Xeon Phi, как сообщают в Intel, также будут усовершенствованы межсоединения и средства работы с памятью, что позволит выделить чип на фоне других сопроцессоров, в том числе графических, которые широко применяются для ускорения технических вычислений.
У Knights Landing будет много ядер, и он сможет работать в суперкомпьютере не только в роли сопроцессора, устанавливаемого в слот PCI-Express, но и в качестве центрального процессора. Это серьезная перемена по сравнению с нынешним чипом Xeon Phi (Knights Corner), который может работать только как сопроцессор и требует, чтобы операционная система и приложения работали на центральном процессоре серверного класса вроде Xeon E5.
«Теперь сам чип это уже не просто сопроцессор, — отмечает Натан Бруквуд, главный аналитик Insight64. — На нем могут исполняться вычислительные задачи и операционная система».
Сегодня суперкомпьютеры одновременно пользуются вычислительной мощью центральных процессоров и сопроцессоров вроде Phi или графических чипов Nvidia Tesla, чтобы решать исследовательские задачи в таких областях, как медицина, оборона, энергетика и естественные науки. Но, учитывая, что Knights Landing — это одновременно и центральный процессор, и ускоритель, суперкомпьютеру понадобится меньше дополнительных комплектующих, благодаря чему может уменьшиться масштаб системы и стоимость ее строительства.
«Новая архитектура радикально повышает быстродействие, поскольку вам уже не нужно будет переносить данные между памятью и платами ускорителей, — добавил Бруквуд. — К тому же меньше комплектующих — значит, меньше счет за электричество».
США, Китай и Япония соревнуются, кто первым достигнет рубежа быстродействия суперкомпьютеров в 1 экзафлопс. Трудности проектирования и высокий расход энергии задерживают появление таких систем, но компании Cray, IBM, Intel и Nvidia разрабатывают все новые серверы и энергоэффективные «мегачипы», обладающие колоссальным быстродействием.
Пиковая производительность самого быстрого суперкомпьютера в мире, китайского Tianhe-2, составляет 33,86 PFLOPS. В нем в качестве основных процессоров используются Intel Xeon E5, а в роли сопроцессоров — нынешние Xeon Phi. Первый суперкомпьютер с быстродействием на уровне 1000 PFLOPS производители процессоров рассчитывают создать к 2020 году.
У Knights Landing будет ряд архитектурных усовершенствований, более высокая пропускная способность и более простой доступ к памяти, сообщил Радж Хазра, вице-президент и генеральный менеджер по техническим вычислениям Intel. Подробностей об усовершенствованиях он не раскрыл, но указал, что на Knights Landing смогут исполняться как параллельные, так и однопоточные приложения.
«Создавая универсальный чип, мы стремились избавиться от ограничений, свойственных раздельным архитектурам, и учесть все требования к суперкомпьютерным процессорам», — отметил инженер.
Интеграция центрального процессора с ускорителем устраняет узкое место, предоставляя высокопараллельным приложениям больше внутренней пропускной способности, полагает Патрик Мурхед, президент, главный аналитик Moor Insights and Strategy: «При использовании Knights Landing в качестве центрального процессора на нем можно будет обрабатывать массово-параллельные задачи, для которых задержка должна быть сведена к минимуму, что сегодня достигается с помощью ускорителей, пользующихся шиной PCI-Express».
Поддержка однопоточных приложений — это крупное усовершенствование по сравнению с Knights Corner, считает аналитик. Сегодня чипы ускорителей оптимизированы в основном для высокопараллельных приложений, а однопоточные приходится исполнять на иных аппаратных модулях, в результате эффективность выполнения задач может пострадать, отмечает Кантер. С универсальным же процессором программистам не придется заботиться о переносе обработки части кода на другое оборудование.