Отрасль производства графических процессоров пережила очередную плановую эволюционную ступень — переход на 28-нм техпроцесс. На этот раз nVidia не заставила нас ждать слишком долго и выпустила новый ГП почти сразу после AMD. Вообще, сейчас обстановка на рынке ГП куда более здоровая, чем, например, с центральными процессорами. Конкуренция между двумя главными игроками очень жесткая, и при этом производительность по-прежнему растет как на дрожжах. Причем далеко не только за счет масштабирования существующих наработок на новые техпроцессы. Видеоплаты медленно, но верно превращаются из узкоспециализированных вычислителей в более универсальные. Но о традиционной потребительской аудитории этих устройств -- геймерах -- пока никто забывать не собирается. Новый продукт nVidia, о котором пойдет речь в статье, хорошее тому подтверждение.
Первая видеоплата нового поколения, вполне ожидаемо, получила имя GeForce GTX 680. Графический процессор GK104, на котором она основана, не только производится по свежему техпроцессу, но и несет в себе заметные изменения в архитектуре. В nVidia новую архитектуру назвали в честь немецкого астронома Иоганна Кеплера.
Для начала обратимся к сухим фактам. Процессор GK104, выполненный на кристалле площадью 294 мм 2 , состоит из 3,5 млрд. транзисторов, в то время как его главный конкурент, AMD Tahiti, насчитывает 4,3 млрд., занимающих 365 мм 2 . Энергопотребление нынешнего флагмана AMD, видеоплаты Radeon HD 7970, составляет 250 Вт, а GeForce GTX 680 --195 Вт. К тому же во многих игровых тестах GeForce GTX 680 превосходит Radeon HD 7970 по производительности.
Теперь давайте разберемся, в чем заключаются ключевые отличия новой архитектуры Kepler от предшествующей ей Fermi. Главное из них -- реструктуризация исполнительных блоков. Обратите внимание на диаграмму. Если ГП GF100, на котором базировалась GeForce GTX 580, имел 16 блоков SM, по четыре в каждом кластере, то GK104 состоит из восьми новых блоков SMX, в которых число ядер CUDA радикально увеличено -- с 32 до 192. И хотя ядер стало больше, работают они медленнее. Ранее шейдерные ядра функционировали на частоте, удвоенной по отношению к общей рабочей частоте ГП, теперь от этого отказались. Это сделано для того, чтобы более эффективно использовать площадь кристалла.
Для повышения энергоэффективности был переработан алгоритм работы планировщика. Такая его функция, как проверка зависимостей между операциями, теперь будет выполняться на этапе компиляции.
Номинальная частота работы ГП высокая -- 1006 МГц. Кроме того, введена новая функция под названием GPU Boost, позволяющая слегка повышать частоту ГП тогда, когда энергопотребление ниже максимума. На референсной версии GTX 680 частота может быть увеличена до 1059 МГц, на разогнанной плате Palit -- до 1150 МГц.
Объем видеопамяти составляет 2 Гбайт, а разрядность контроллера памяти -- всего 256 бит. При этом частота поднята до 6 ГГц, что обеспечивает такую же пропускную способность, какая была у GTX 580.
Графический процессор nVidia GK104 содержит в себе 1536 ядер CUDA,
распределенных по четырем кластерам (GPC – Graphics processing
cluster) и восьми блокам SMX (Stream multiprocessor). Каждый блок
SMX имеет по 64 Кбайт общего кеша данных, кеш инструкций и спе-
циализи рованный кеш текстурных и шейдерных блоков, а также соб-
ственный геометрический движок PolyMorph. Каждый кластер снаб-
жен собственным растеризатором. Кроме того, в процессоре имеется
общий кеш данных второго уровня объемом 512 Кбайт.
Тестовый стенд
Все измерения проводились на тестовом стенде, собранном из процессора Intel Core i7-3770K, системной платы Intel DZ77GA-70K, комплекта модулей памяти Kingston KHX2400C11D3K4/8GX (DDR3-2133, четыре модуля по 2 Гбайт), блока питания Corsair HX650W, жесткого диска Seagate Barracuda 7200.11 ST31500341AS емкостью 1500 Гбайт. На стенд была установлена 64-разрядная ОС Windows 7 SP1 Ultimate.
Asus GTX680-2GD5
Видеоплата компании Asus выполнена в полном соответствии с эталонным дизайном nVidia. Главным преимуществом этого решения является, конечно, охладитель, выдувающий 100% горячего воздуха за пределы корпуса. Он придется по душе обладателям компактных или плохо вентилируемых корпусов. Конструкция радиатора претерпела изменения по сравнению с предыдущим поколением. Внешне он очень похож на тепловую камеру, хотя nVidia заявляет, что в его основе лежит встроенная тепловая трубка (embedded heat-pipe).
Для питания платы понадобятся два 6-контактных разъема. На задней панели расположены два гнезда DVI: цифровое DVI-D и универсальное DVI-I, а также по одному выходу HDMI и DisplayPort.
Palit GeForce GTX 680 Jetstream
Компания Palit в последнее время активно экспериментирует с системами охлаждения для своих видеоплат. Ускоритель на ГП нового поколения получил новый кулер – Jetstream. Его отличительной особенностью является наличие трех больших вентиляторов: два -- диаметром по 80 мм и один -- 90-мм. Это не первый охладитель подобной конструкции: в модельном ряду компании Gigabyte встречаются платы с тремя вентиляторами. Тепло от ГП отводится радиатором с четырьмя медными тепловыми трубками. Лицевая сторона платы почти полностью закрыта пластиной, отводящей тепло от микросхем памяти и полевых транзисторов, питающих ГП. Размеры кулера слегка превышают ширину двух разъемов расширения, поэтому в тот, что находится через один от видеоплаты, не получится установить не то что вторую видеоплату, но и даже компактную звуковую плату или ТВ-тюнер.
Фактически Jetstream занимает три слота расширения, как и видеоплата компании Asus, речь о которой пойдет ниже, хотя по ее внешнему виду об этом сразу и не догадаешься.
Частоты работы ГП и памяти подняты заметно выше номинала: на 85 и 300 МГц соответственно. При этом на данной видеоплате применены такие же микросхемы памяти, что и на эталонном образце nVidia: Hynix H5GQ2H24MFR. Энергопотребление платы также отличается от референсного: 215 вместо стандартных 195 Вт.
Asus HD7970-DC2T-3GD5
Отличительной особенностью этой видеоплаты является особая система охлаждения Asus DirectCu II, которая занимает место трех плат расширения.
Это легко понять, увидев число занимаемых посадочных мест на задней панели корпуса. На ней расположены разъемы выходов DVI-I и DVI-D, а также четыре гнезда DisplayPort. К плате можно подключить до шести дисплеев без помощи внешнего хаба. Это рекорд для видеоплаты, позиционируемой для потребительского рынка.
Задняя сторона платы закрыта металлической пластиной, не соприкасающейся с компонентами, распаянными на плате. Эта пластина нужна лишь для надежного крепления массивного кулера. Все 12 микросхем памяти, как и греющиеся элементы цепей питания, распаяны на лицевой стороне платы.
Она также закрыта металлической пластиной, имеющей тепловой контакт с микросхемами памяти. Массивный радиатор на основе шести медных тепловых трубок обдувается двумя 90-мм вентиляторами. Весь горячий воздух рассеивается внутри корпуса.
Частоты работы ГП и видеопамяти подняты на 75 и 100 МГц соответственно.
«Фишкой» данной видеоплаты является наличие на ней специальных точек, которые можно пайкой соединить проводами с вольтметром или, что гораздо лучше, с системой мониторинга напряжений системной платы Asus серии ROG. Это позволит следить за ключевыми напряжениями (питающими напряжениями ГП, памяти и системы фазовой автоподстройки частоты (PLL)) с помощью специальной программы.
Asus HD7870-DC2-2GD5
Эта видеоплата основана на графическом процессоре Pitcairn и находится в ценовой категории чуть ниже, чем рассмотренные выше. В нашем обзоре, посвященном видеоплатам среднего ценового сегмента (см. «Мир ПК», №5/12, с.32), мы не успели протестировать ни одного образца Radeon HD 7870, и потому добавили его в эту статью. По цене она близка к видеоплате GeForce GTX 580, а по производительности слегка уступает ей.
Однако покупать сейчас GTX 580 представляется не самым лучшим решением, имеет смысл дождаться от nVidia выпуска менее дорогого 28-нм чипа.
Эта видеоплата сильно разогнана: частота работы ГП стала на 100 МГц выше и без того немалой номинальной, а частота памяти -- на 200 МГц.
Процессор охлаждается радиатором на основе трех тепловых трубок диаметром по 8 мм и двумя вентиляторами. Чипы памяти не имеют собственных радиаторов и охлаждаются лишь обдувом. Набор видеовыходов на задней панели слегка отличен от стандартного: DVI-D, DVI-I, HDMI и DisplayPort. Референсные платы данной серии имеют по два гнезда Mini DisplayPort и по одному гнезду DVI-I.
***
Итоги
Во время написания этой статьи Radeon HD 7970 был доступен в московской рознице в диапазоне цен 15,5--20 тыс. руб. Первоначально обещанные производителями видеоплат цены на GeForce GTX 680 находятся в районе 18 тыс. руб., но поскольку они новые, их пока продают дороже. Вероятно, к тому времени, когда этот номер журнала поступит в продажу, цены нормализуются. Как видите, в большинстве тестов GeForce GTX 680 оказался быстрее Radeon HD 7970, хотя в нашем исследовании участвовала сильно разогнанная версия этой видеоплаты. Пока экономным можно порекомендовать обратить внимание на самые дешевые версии Radeon HD 7970, а терпеливым — дождаться снижения цен на GTX 680. Что будет дальше, сказать сложно. Теоретически nVidia имеет больший потенциал для того, чтобы снизить цену на свою флагманскую модель. В то время как компания AMD, желая сделать свой ГП более пригодным для неграфических вычислений, пожертвовала производительностью в 3D, nVidia поступила прямо противоположно. Впрочем, nVidia традиционно создает для себя имидж премиум-бренда и делает свои продукты чуть дороже, чем у конкурента. Не исключено, что так произойдет и в этот раз.
Выпустив такой необычный процессор как GK104, nVidia проявила смелость, первой сделав шаг в сторону снижения «стандартного» термопакета видеоплат, который ранее ограничивался лишь нормативом PCI Express, подчас лишь формально. Сейчас на уровне слухов существует информация о планах nVidia относительно выпуска двухчиповой видеоплаты на основе пары ГП KG104. С внедрением PCI Express 3.0 необходимость в двучиповых платах должна снизиться. Тесты для этого обзора мы проводили на нашем новом тестовом стенде на основе процессора Intel Core i7-3770K. Как видите, производительность отлично масштабируется при включении SLI. Похоже, что восьми линий PCI Express 3.0 видеоплатам хватает. Так что теперь не обязательно покупать дорогую системную плату, чтобы построить массив.