Прогнозы о том, что многопроцессорные настольные ПК совсем скоро станут обыденностью, пожалуй, начинают сбываться. Фирма Apple уже давно предлагает подобные изделия. Видимо, недолго осталось ждать и сторонникам IBM PC. А поскольку разработка новых алгоритмов и программ происходит значительно медленнее совершенствования вычислителей, то мы решили посмотреть, готово ли популярное ПО к полноценной реализации их новых возможностей.
Для тестирования была взята графическая станция Race 750 российской компании DЕPO. Эта мощная система на базе двух 3,06-ГГц процессоров Xeon оснащена 4-Гбайт оперативной памятью и парой жестких SCSI-дисков емкостью по 70 Гбайт. (Позволительно дополнить дисковый RAID-массив еще пятью SCSI-дисками.) А по-настоящему графической станцией эта машина становится благодаря профессиональному видеоускорителю Quadro FX 1000.
Конечно, всем понятно, что полностью раскрыть потенциал такой системы можно, например, путем испытания на ней какого-либо «тяжелого» пакета САПР для физического моделирования процессов в твердом теле, жидкости или газе либо созданием пары 3D-монстров для очередного киношедевра.
Мы решили выяснить, насколько эффективно используются ресурсы рабочей станции графическими программами для трехмерного моделирования, которые мы привыкли видеть на обычных персональных компьютерах. Данный эксперимент можно сравнить с ралли болида гонок «Формула-1» по бездорожью, но зато мы получим ответ на вопрос: «А готовы ли привычные графические инструменты к качественному скачку на многопроцессорные рабочие станции?»
Для тестирования были взяты Adobe Photoshop 7.01, Adobe Premiere 6.0, Aura 2, Corel Bryce 5.1, Povray 3.5, 3DStudioMax 5.1, Sisoftware Sandra, 3DMark и набор стандартных демонстрационных программ SDK DirectX 9.0.
Adobe Photoshop — самый популярный графический (растровый) редактор нашего времени, ставший стандартом де-факто в области допечатной подготовки, веб-дизайна и текстурирования 3D-моделей. Сам по себе он не требует очень мощного компьютера. В основном процессорные ресурсы расходуются на его наборы фильтров, кстати, также широко применяемые другими растровыми и видеоредакторами. К сожалению, мои попытки найти фильтр, использующий оба процессора, не увенчались успехом. Фильтр Skay, один из самых сложных в наборе Kay Power Tools 6, работал в двухпроцессорном режиме, однопроцессорном и однопроцессорном с выключенной технологией Hyper-Threading практически одинаково.
Кроме того, ресурсы компьютера потребляет и система управления «историей обработки» изображения в Photoshop. Здесь речь идет о хранении в оперативной памяти вариантов изображения, подвергающегося модификации, и последующем восстановлении исходного. В имеющейся версии Photoshop можно было работать с ОЗУ объемом лишь до 2 Гбайт, так как больший он просто не воспринимал в опциях настройки. Для того чтобы загрузить 2 Гбайт памяти, пришлось создать изображение кинематографического качества с разрешением 4000Ё4000 точек. Затем я применил несколько десятков фильтров и проделал ряд операций модификации вручную. В подобной ситуации Photoshop довольно легко задействовал 1,5 Гбайт оперативной памяти, а потом умерил свой аппетит и с трудом подобрался к 1,75 Гбайт, предельному значению при заданных настройках. Похожая ситуация возникла и при работе с программой Aura, наотрез отказывавшейся взаимодействовать с ОЗУ объемом свыше 1 Гбайт.
Adobe Premiere, пожалуй, можно считать одной из наиболее распространенных программ нелинейного видеомонтажа. Как и предыдущий пакет, она использует все ресурсы процессора только при рендеринге и обработке видеофрагментов многочисленными фильтрами. Аналогичным оказалось ее отношение к многопроцессорности и Hyper-Threading.
Bryce — довольно известный простой продукт, предназначенный для моделирования ландшафтов и их фотореалистичного рендеринга. Так же, как и программа Povray — свободно распространяемый «движок» фотореалистического рендеринга — она не способна реализовать те преимущества, которыми располагает рабочая станция DEPO Race 750.
3DStudioMax — пакет 3D-моделирования и анимации, порадовавший нас применением всех вычислительных ресурсов двухпроцессорных систем. Полуторакратное ускорение на обоих процессорах — весьма достойный результат, практически близкий к пределу. Правда, добавление режима Hyper-Threading не дало какого-либо существенного прироста производительности.
Sisoftware Sandra — современный набор синтетических тестов. Он позволяет определить производительность системы при работе с арифметическими и мультимедийными (векторными) данными. Результаты, приведенные в таблице, говорят сами за себя. Этот тестовый пакет полностью раскрыл потенциал DEPO Race 750. Особенно радует двукратное ускорение обработки мультимедиа-данных на обоих процессорах.
3DMark еще недавно считался безоговорочным лидером среди программ для тестирования видеоускорителей. Данные тесты основаны на реальных игровых «движках» других производителей. Дополнив его результаты измерениями, проведенными с помощью небольших тестовых программ SDK DirectX 9, удалось прийти к интересным выводам. Во-первых, как и следовало ожидать, производительность графических тестов никак не связана с наличием или отсутствием второго процессора, так же как и технологии Hyper-Threading. Во-вторых, наличие профессиональной платы уровня Quadra FX 1000 скорее необходимость, чем прихоть. Результаты, полученные при разрешении 400Ё300 точек, можно считать минимально допустимыми, особенно если учесть, что в реальных приложениях часть ресурсов будет расходоваться на реализацию логики программы. Так что когда вы надумаете отображать самые сложные визуальные эффекты в реальном времени, не скупитесь и приобретайте профессиональный видеоускоритель.
* * *
Большинство популярных программ для работы с графикой, в том числе и 3D-рендеры, не требуют оперативной памяти более 2 Гбайт, двухпроцессорных систем и технологии Hyper-Threading. Следовательно, на вопрос: «Стоит ли ждать, когда разработчики перепишут свое ПО под многопроцессорные системы?» — в большинстве случаев можно ответить «нет», ведь основная часть алгоритмов изначально ориентированы на единственный процессор, и переделывать их не всегда целесообразно. Поэтому, если вы намерены совершенствовать свое мастерство, стоит присмотреться к более профессиональным программам, коих существует великое множество.
Что же касается рабочей станции DEPO Race 750, то работа с ней доставила большое удовольствие. Особенно порадовали скорость в графических тестах и, самое главное, великолепное качество изображения 3D-сцен с применением сложных визуальных эффектов как в тестах, так и в режиме моделирования 3DStudioMax.
Виталий Галактионов, vit@osp.ru
Результаты тестирования
Название теста, размерность | Режим 1 | Режим 2 | Режим 3 |
Photoshop, с | 2,57 | 2,55 | 2,55 |
Premiere, с | 24 | 24 | 26 |
Povray, с | 8,44 | 9,1 | 8,43 |
3Dmark CPU, отн. ед. | 606 | 600 | 618 |
3Dmark, отн. ед. | 3718 | 3710 | 3718 |
Bryce, с | 1,55 | 1,57 | 1,55 |
SDK DirectX 9, кадр./с: | |||
SelfShadow | 725 | 725 | 724 |
VolumeFog | 174 | 173,5 | 173 |
PointSprites | 159 | 158 | 158 |
Fur | 340 | 340 | 340 |
DXSkinnedMesh | 2059 | 2058 | 2048 |
BumpWaves | 1771 | 1767 | 1766 |
3DStudioMax, с | 1,43 | 1,4 | 1,07 |
Sandra Proc Whetstone, MFLOPS | 7736 | 9699 | 13 182 |
Sandra Proc Dhrystone, MIPS (integer/float) | 2240/ 4136 | 3647/ 6581 | 6141/10 295 |
Sandra Multimedia Integer, инстр./с | 18 958 | 23 483 | 46 901 |
Sandra Multimedia Float, инстр./с | 22 444 | 33 982 | 66 140 |
Примечание. Режим 1 — один процессор без поддержки Hyper-Threading; режим 2 — один процессор с поддержкой Hyper-Threading; режим 3 — два процессора с поддержкой Hyper-Threading.