В середине декабря 2010 г. компания AMD наконец-то официально представила новую серию игровых видеоплат Radeon HD 6900. Мы испытали референсные образцы этих устройств и спешим поделиться с вами своими наблюдениями.
Новая архитектура
Графические процессоры AMD предыдущей линейки, Evergreen, как помнит внимательный читатель, именовались по названиям различных вечнозеленых деревьев и кустарников. Новая линейка ГП, об одном из которых и пойдет речь в этой статье, называется Nothern Islands. Эти ГП именуются в честь островов Карибского моря.
Процессор, на котором основаны две новые видеоплаты серии 6900, получил название Cayman. Изначально новую серию ГП предполагалось производить по 32-нм техпроцессу, но впоследствии компания TSMC, изготавливающая микросхемы для AMD, отказалась от его освоения. В результате новое поколение ГП было разработано под 40-нм технологию. Однако благодаря оптимизации и переработке архитектуры, выполненным инженерами AMD, новые видеоплаты получились более производительными, чем их предшественники серии 5800.
Cayman — первый графический процессор AMD, основанный на новой архитектуре VLIW4. До этого актуальной была архитектура VLIW5, на которой базировались все последние ГП, включая Barts (серия Radeon HD 6800). Главное отличие новой архитектуры заключается в том, что теперь в каждом SIMD-модуле находится не пять, а четыре потоковых процессора, имеющих равные возможности. Ранее во всех SIMD-модулях имелся отдельный потоковый процессор, выделенный под текстурные вычисления. Новая архитектура дает 10%-ный прирост эффективности использования площади кристалла, а также улучшает производительность процессора в вычислениях GPU. Кроме того, был усовершенствован растеризатор, и теперь 16-бит целочисленные операции выполняются быстрее в 2 раза, а операции с плавающей запятой — в 2—4 раза.
Новая функциональность ГП
Когда мы рассказывали о видеоплатах серии 6800, то был упомянут новый алгоритм сглаживания Morphological AA (см. «Мир ПК», № 12/10, с. 22). Повторяться на эту тему нет смысла: разумеется, Cayman поддерживает MLAA.
Результаты тестирования производительности программой FutureMark 3DMark 11 в различных режимах, баллы |
Вместе с выпуском нового ГП фирма AMD вводит в обиход очередной алгоритм сглаживания, именуемый EQAA (Enchanced Quality AA — сглаживание повышенного качества). Он представляет собой усовершенствованную версию привычного нам MSAA. Давайте немного разберемся с тем, как он работает. Принцип действия всех алгоритмов сглаживания при визуализации трехмерной графики схож. Он заключается в том, что для визуализации одного видимого пиксела используется несколько отсчетов, часто называемых субпикселами. Простейшим путем реализации этого принципа будет просто визуализировать нужный участок изображения с большим разрешением, чем необходимо, а затем масштабировать его до нужного. Однако такой способ был бы чрезмерно ресурсоемким, поэтому разработчики стараются оптимизировать его.
Принцип действия EQAA схож с CSAA, давно реализованным компанией nVidia.Если при работе алгоритма MSAA учитываются как цвет, так и расположение всех используемых субпикселов, то в режиме EQAA дополнительно применяются вспомогательные субпикселы, обрабатываемые лишь алгоритмом Z-буферизации. Это позволяет повысить точность сглаживания. Отличие EQAA от CSAA заключается в трафарете расположения субпикселов и их количестве. В EQAA число вспомогательных субпикселов всегда равно числу полноценных, т. е. при кратности EQAA 8x для визуализации одного пиксела используется восемь полноценных субпикселов и восемь дополнительных. С режимами CSAA у nVidia не все так просто. Во всех режимах кратности 4x и выше число полноценных субпикселов составляет четыре, а число вспомогательных равно кратности сглаживания. В режимах повышенного качества, обозначающихся буквой Q (например, CSAA 8xQ), число полноценных субпикселов равняется восьми.
Результаты тестирования производительности в игре Lost Planet 2 (DirectX 11), кадр/с |
Сглаживание в режиме EQAA должно корректно работать во всех играх, поддерживающих MSAA. Включить этот режим можно в настройках Catalyst.
Еще одним новшеством процессора Cayman является технология AMD PowerTune. В микросхему встроен контроллер, отвечающий за питание процессора. Он автоматически подсчитывает энергопотребление каждого модуля ГП и регулирует частоту, для того чтобы сохранить энергопотребление в разумных пределах. В настройках Catalyst (меню ATI Overdrive) можно настроить допустимое энергопотребление видеоплаты в пределах +/–20% от номинала. Путем такой регулировки можно либо добиться максимальной производительности видеоплаты, либо, наоборот, ограничить энергопотребление (а соответственно и уровень шума) в не очень ресурсоемких играх, где быстрая видеоплата выдает приемлемое количество кадров в секунду даже при ограниченном энергопотреблении.
Особенности новых видеоплат
Отличия Radeon HD 6950 от 6970 заключаются в частотах работы ГП и памяти, а также в числе активных потоковых процессоров (см. соответствующую таблицу). Обе видеоплаты оснащены 2 Гбайт скоростной памяти типа GDDR5. Внешне они очень похожи друг на друга; помимо маркировки, их можно различить по наличию 8-контактного разъема питания на Radeon HD 6970. Ее пиковое энергопотребление составляет 250 Вт, а энергопотребление Radeon HD 6950 — 200 Вт. В состоянии простоя обе платы потребляют по 20 Вт. На задней панели находятся два выхода Mini DisplayPort 1.2, один выход HDMI 1.4a и по одному выходу Single-Link DVI и Dual-Link DVI. Таким образом, покупателю сразу доступен трехмониторный режим Eyefinity почти независимо от того, какие входы есть на его мониторах, лишь бы один из них имел любой цифровой вход. При использовании хаба DisplayPort возможно подключить к видеоплате до шести мониторов.
Результаты тестирования производительности в игре Resident Evil 5 (DirectX 10), кадр/с |
Еще одной особенностью плат серии 6900 является наличие двух независимых микросхем BIOS. Переключение между ними осуществляется аппаратно, посредством миниатюрного переключателя, расположенного рядом с контактными площадками для подключения шлейфов CrossFireX. Одна из микросхем защищена от записи, что позволяет в любой момент запустить видеоплату при номинальных настройках. Вторая микросхема предназначена для экспериментов с разгоном.
Охлаждение ГП и нескольких микросхем памяти выполняет популярный в настоящее время кулер на основе тепловой камеры. Остальные микросхемы памяти охлаждаются теплорассеивающей пластиной, закрывающей всю обратную сторону платы.
Методика тестирования
При тестировании новых видеоплат мы использовали драйвер AMD Catalyst версии 10.12. Конфигурация тестового стенда и набор тестового ПО не претерпели изменений со времени последнего обзора видеоплат, правда, за одним исключением. Недавно компания FutureMark выпустила новую версию своего графического теста — 3DMark11. Свое название она получила вследствие поддержки DirectX 11. Стоит заметить, что произошло это весьма вовремя, и мы с радостью использовали новый тест при первой же возможности. В том числе он поддерживает тесселяцию и пространственное освещение. На этот раз тесты, использующие PhysX, отсутствуют. Для оценки производительности процессора применен физический движок Bullet, использующий как центральный, так и графический процессор через Direct Compute. Всего сценарий включает в себя четыре графических теста, один, оценивающий только возможности ЦП, и комбинированный. По окончании тестового сценария выставляется единая итоговая оценка.
Результаты тестирования производительности в игре Metro 2033 (DirectX 11), кадр/с |
В таблицах, как обычно, приведены результаты для некоторых видеоплат, взятые из предыдущих статей. Стоит помнить, что nVidia GeForce GTX 480, AMD Radeon HD 5970 и Radeon HD 5870 были протестированы довольно давно, после чего тестовый стенд был модернизирован. Это нужно учитывать при сравнении их результатов с показателями более новых плат.
* * *
Сейчас модель Radeon HD 6970 доступна в столичных магазинах по цене от 14 тыс. руб., что очень близко к цене nVidia GeForce GTX 570, а Radeon HD 6950 — от 12 тыс. руб. Вероятно, в ближайшее время по мере наполнения складов новыми продуктами эти цены немного опустятся. Мы пока не успели протестировать видеоплату GeForce GTX 570, поэтому воздержимся от окончательных выводов.
Что же касается сравнения Radeon HD 6970 и GTX 580, то, как видите, в играх, использующих DirectX 11, разница их производительности не превышает 15% (в пользу GTX 580), в то время как по цене они различаются примерно на 4 тыс. руб.
В 2011 г. компания AMD планирует выпустить новую двухпроцессорную видеоплату Antilles. До этого времени самой производительной платой в их ассортименте продолжает считаться Radeon HD 5970. Как уже было отмечено, наши данные полуторагодовалой давности не слишком корректны, так как доступны результаты лишь одного теста. Но тем не менее в настоящее время покупка Radeon HD 6970 представляется куда более разумным решением, чем «монстра» 5970, который имеет большие энергопотребление и габариты при символической разнице в производительности.
Результаты тестирования программой Unigine Heaven Benchmark (DirectX 11), кадр/с / баллы
Результаты тестирования производительности в игре Mafia 2 (DirectX 11), кадр/с