В компании Nvidia рассчитывают принять участие в создании мощнейших компьютеров мира, предлагая графический процессор Tesla K40, самый быстрый свой чип на сегодня, предназначенный для ускорения суперкомпьютерных вычислений.
Tesla K40 обладает быстродействием 1,43 TFLOPS, что примерно на 20% больше по сравнению с предшественником, Tesla K20X, который был представлен год тому назад. Сопроцессоры Nvidia Tesla широко используются в суперкомпьютерах наряду с центральными для обработки сложных научных задач.
K40 «быстрее во всех отношениях», чем K20X, заявил Сумит Гупта, генеральный менеджер подразделения Nvidia Tesla Accelerated Computing.
Новый чип основан на видоизмененной архитектуре Nvidia Kepler, которая также использовалась в основе K20X. Предыдущий чип применяется, в частности, в суперкомпьютере Titan американского министерства энергетики. Имея быстродействие 17,59 PFLOPS, эта система была самым быстрым суперкомпьютером в мире до июня этого года, когда ее превзошел китайский Tianhe-2, основанный на чипах Intel Xeon E5 и сопроцессорах Xeon Phi. Производительность китайской машины — 33,86 PFLOPS.
Чипы Tesla также используются в некоторых рабочих станциях, но для персональных компьютеров не предназначены. Системы на базе K40 собираются проектировать в компаниях Cray, HP, Dell, IBM, Silicon Graphics, ASUS и других. В Nvidia не указали, когда новый процессор может появиться в суперкомпьютерах.
K40 имеет 2880 графических ядер и 12 Гбайт памяти, вдвое больше, чем у K20X. Базовая тактовая частота ядер — 745 МГц. В зависимости от потребностей текущей задачи ее можно повысить до 810 или 875 МГц. Возможность отключать ядра по отдельности для экономии энергии отсутствует, то есть весь чип либо активен, либо нет, указал Гупта. Тем не менее, утверждает он, K40 более энергоэффективный, чем предшественник.
Целый ряд государств стремятся достичь цели создания экзафлопсной машины к 2020 году, в связи с чем предпринимаются всевозможные усилия по повышению быстродействия суперкомпьютеров. Производители оборудования пытаются одновременно и уменьшать расход энергии процессорами и другими комплектующими, и увеличивать быстродействие систем