Еще совсем недавно простая экстраполяция закона Мура давала основание утверждать, что суперкомпьютер с производительностью 1 EFLOPS будет создан в 2018 году, однако сегодня ясно, что к этому времени наиболее мощные компьютеры будут в три — пять раз медленнее, отмечалось в ходе недавней суперкомпьютерной конференции SC14. В определенной степени отставание определяется тем, что на выделенные американским правительством 425 млрд долл. к 2017 году удастся построить только две машины, Sequoia и Sierra, для крупнейших национальных лабораторий. Эти компьютеры потеснят позиции систем х86-архитектуры в Top500 — они построены в рамках инициативы OpenPower, в которой ведущие роли принадлежат компаниям IBM, Nvidia и Mellanox.
Обе машины нарушают сложившуюся традицию экстенсивного наращивания производительности. Они станут первыми представителями архитектуры Multi-GPU Computing на основе гетерогенной вычислительной модели (Heterogeneous Computing Model, HCM) и высокоскоростного межсоединения между центральными и графическими процессорами Nvidia NVLink. Суть HCM — в способности отражать гетерогенную природу реальных данных, при обработке которых возникают периоды различной нагрузки. Иногда их удается с успехом распределить между тысячами узлов, а иногда требуется длительная последовательная обработка. Поэтому требуется архитектура, в равной степени приспособленная к разным видам нагрузки, иначе говоря, необходимо в одном узле обеспечить эффективное взаимодействие набора из нескольких графических процессоров с одним центральным. Обмен данными между ними осуществляется через NVLink, который в несколько раз энергоэффективнее и на порядок быстрее, чем PCIe Gen3 x16, а также обеспечивает унифицированный доступ процессоров к памяти. Вероятно, в Sequoia и Sierra будет использована версия NVLink 2.0, поддерживающая когерентность кэша, что еще больше повышает производительность, а Mellanox EDR Infiniband будет работать в качестве системного межсоединения между узлами.