Второе дыхание SPARCЗа 2010 год значения теста TPC-C для систем от Sun Microsystems выросли в три раза, чего не было за десять лет их присутствия в данном рейтинге. Такой результат по коротким транзакциям был получен на конфигурации из 27 узлов, что достаточно много для кластерной архитектуры. Фактически это стало доказательством возможности организации значимых OLTP-вычислений на кластерах, собранных из небольших и доступных по цене серверов.

Тестовая конфигурация Oracle SPARC Supercluster построена на основе 27 серверов Sun SPARC T3-4, связанных межсоединением на основе 10 Gigabit Ethernet и подключенных к двум сетям хранения. Одна сеть хранения, построенная на основе коммутаторов Brocade DCX, используется для хранения файлов базы данных, а вторая, емкостью 560 Тбайт, на основе двух коммутаторов Brocade 5300, выделена для хранения REDO-файлов СУБД Oracle. В обеих сетях хранения отсутствуют классические системы хранения: в качестве дисковых массивов используются серверы Oracle архитектуры x64, укомплектованные большим количеством внутренних жестких дисков и твердотельными накопителями, подключенными по протоколу SAS. Практически весь весь объем дисковой памяти доступен по сети хранения благодаря технологии OpenSolaris COMSTAR. Общий объем дисков для хранения данных составляет порядка 950 Тбайт, из них 264 Тбайт — хранилище на SSD, что серьезно повышает производительность конфигурации в целом.

Все компоненты тестовой конфигурации (кроме серверов Sun SPARC Т3-4) давно известны, а технологии Oracle Real Application Clusters (RAC) вообще почти десять лет. Основная причина скачка производительности кроется в сочетании технологий SPARC T3 и RAC, при помощи которых впервые удалось сконцентрировать свыше 95% латентности блокировок на уровне кристалла.

Ключевым отличием вертикально масштабируемой SMP-системы от классического многоузлового кластера является наличие в иерархии коммутаций третьего уровня (L3). При этом первые два блока этой схемы всегда представляют собой образ вертикально масштабируемой SMP-системы, в рамках которого соотношение латентностей первого и второго уровней (L1 и L2) составляет примерно 1:100. Добавление кластерного уровня над вертикально масштабируемой SMP-системой всегда с точки зрения латентности блокировок оказывается еще на два порядка хуже, и именно поэтому кластерные конструкции на протяжении последнего десятилетия не могли на OLTP-приложениях реально конкурировать с вертикально масштабируемыми SMP-системами.

Невозможность достижения приемлемой латентности объясняет, наряду с другими факторами, отсутствие на рынке SMP-систем с большим числом вычислительных элементов — лучшие такие системы обычно расширяются до 32-64 физических процессоров, располагающихся на четырехпроцессорных компонентах первого уровня коммутации, хотя теоретический потенциал данной архитектуры намного выше. Таким образом, кластерная конфигурация всегда по латентности будет проигрывать вертикально масштабируемой SMP-системе.

Инженеры Oracle объединили три уровня латентности в два: после приобретения Sun Microsystems корпорация стала обладателем технологии реально многоядерного (16 ядер и 128 потоков) процессора SPARC T3 и операционной системы Solaris, способной работать со всеми потоками. Все это позволило сконцентрировать на уровне L1 весь объем латентности, фактически устранив из тестовой конструкции уровень L2. В результате на многоузловом кластере можно уже не просто достичь параметров масштабируемости SMP-системы, а втрое их перекрыть.

Общее соотношение латентностей уровней L1/L3 в новой конструкции осталось как минимум не хуже классического уровня вертикально масштабируемой SMP-системы, причем даже с применением в тестовой конфигурации далеко не самого эффективного на данный момент межузлового соединения 10 Gigabit Ethernet (в тесте не использовались такие интерфейсы, как SCI (задержка 1-2 мкс) или Infiniband (3-4 мкс)).

Технология RAC позволяет строить отказоустойчивые и масштабируемые информационные системы, объединяя серверы в кластеры. Экземпляры СУБД Oracle здесь одновременно выполняются на серверах кластера, а управление общей базой данных производится экземплярами совместно — с точки зрения приложения это единая база данных.

Функционирование Oracle RAC невозможно без доступа всех узлов кластера к общим устройствам хранения, и для обеспечения такого доступа используется технология Oracle ASM, предоставляющая конкурентный доступ ко всем устройствам хранения на блочном уровне (в кластере для теста TPC-C доступ к сети хранения обеспечивается через сеть хранения на базе Fibre Channel). Для кластерного межсоединения используется сеть 10 Gigabit Ethernet, а не привычный в таком случае Infiniband, что говорит о высокой степени оптимизации RAC и системного ПО.

Какие преимущества могут получить потребители от платформы Oracle SPARC Supercluster? Прежде всего, узлы кластера на процессорах SPARC T в три-четыре раза с дешевле по сравнению с вертикально масштабируемыми SMP-системами и имеют более низкие эксплуатационные и модернизационные расходы. При этом результаты теста TPC-С доказали возможность создания реального эффективного транзакционного кластера на основе серверов SPARC T3-4, а именно: 30 млн tpmC для кластера из 27 серверов SPARC T3-4 вместо вертикально масштабируемых серверов у других производителей, имеющих втрое и более меньшую производительность (см. таблицу).

Второе дыхание SPARC

Стоимость отдельной транзакции в данном тесте составляет 1 долл., что для системы, эмулирующей доступ 23 млн пользователей, неплохой результат, позволяющий говорить о резервах снижения стоимости отдельной транзакции в реальных вычислительных системах за счет применения более высокопроизводительных кластерных узлов и низкой стоимости их обслуживания. Кроме того, потребители получают практически неограниченную масштабируемость для задач оперативной обработки транзакций; возможность поэтапного масштабирования кластера как по горизонтали (путем добавления новых узлов при достаточно низкой стоимости каждого узла, его обслуживания и модернизации), так и по вертикали путем актуализации конфигурации за счет установки современных узлов.

Система SPARC Supercluster имеет также расширенные возможности для консолидации и виртуализации за счет большой удельной мощности каждого узла и эффективного управления. В общей стоимости кластера SPARC Supercluster, используемого для выполнения теста TPC-С, стоимость программного обеспечения составляет 36%. Для привлечения внимания пользователей к своей системе производитель установил для процессоров SPARC T расчетный коэффициент 0,25 (для сравнения: SPARC64 — 0,5; Itanium 93xx и IBM P7 — 1), а это реальный шаг к снижению стоимости высокопроизводительной инфраструктуры для всех программных продуктов Oracle.

 

"Эллисонизация" SPARC

В амбициозных планах Ларри Эллисона - ускорение вывода на рынок новых SPARC-технологий по сравнению темпами, намеченными Sun Microsystems до своего поглощения. Утверждается, что следующий процессор SPARC T4 (кодовое название Yellowstone Falls в терминологии Sun) при частоте 4 ГГц, которой планируется достигнуть к середине 2011 года, будет в три раза быстрее чем T3. Производительность ожидается на уровне 20 SPECint2006 и приблизится к рекордсмену — Intel Xeon X5677 (40 SPECint2006). При этом количество ядер в Т4 вдвое меньше, чем в Т3, это связано с тем, что Т4 планируется выпускать по технологии 40 нм. Как только технологический партнер Oracle, компания TSMC, перейдет на процесс 28 нм, количество ядер будет доведено до 16 при одновременном увеличении тактовой частоты (проект T4+, бывший Cascade Falls). На их основе планируется создание четырехпроцессорных систем. В проекте Cascade Falls первоначально планировалось построение 192 процессорных систем, однако в связи с прорывами в области кластерных вычислений потребность в таких огромных SMP-системах стала неактуальной.

Все это означает, что новые системы на базе T3/T4 (программно, кластерно и виртуализационно совместимые с текущими) в 2011 году смогут обеспечить 100 млн tpmC при цене транзакции менее 0,3 долл., и при этом производительность одного сервера Т4 будет сопоставима с производительностью Sun SPARC Enterprise М9000 в максимальной конфигурации.

Согласно объявленной долгосрочной программе, компания Oracle будет развивать собственные технологии, и, например, альянс с Fujitsu, созданный с целью построения на базе микропроцессоров SPARC64 старших моделей серверов SPARC, рассматривается теперь  как временный: созданные в его рамках системы имеют принципиально разные механизмы виртуализации и работы с доменами, в отличие от серверов на базе микропроцессора T*. Системы на SPARC64 построены по вертикальному принципу и близки по своей архитектуре к решениям IBM и HP.

 

Процессоры SPARC T3, Т4, Т5

На конференции Oracle OpenWorld 2010 был представлен процессор семейства Niagara SPARC T3 с 16 ядрами, что позволяет построить на нем полноценную компьютерную систему, включающую вычислительные ресурсы, сетевые интерфейсы, ввод/вывод и аппаратную поддержку алгоритмов обеспечения безопасности. Процессор используется в линейке серверов SPARC T3 и в лезвиях для серверов SPARC T3-1B. Микропроцессор (кодовое название Rainbow Falls) выполняет восемь командных потоков в каждом ядре, работает на частоте 1,65 ГГц и реализован с использованием технологии 40 нм. Согласно ранее существовавшим планам, компания Sun Microsystems предполагала достичь тактовой частоты 2,5 ГГц к концу 2011 года в микропроцессоре Yosemite Falls (восемь ядер/восемь потоков) для техпроцесса 40 нм, а к концу 2012-го на техпроцессе 28 нм получить новую пару чипов Yellowstone Falls и Cascade Falls с частотой не менее 3 ГГц с четырьмя или 16 восьмипотоковыми ядрами. Согласно обновленному плану развития процессоров, серия SPARC T становится частью технологий SPARC Supercluster и параллельной машины Exadata. Процессор SPARC T4 будет иметь принципиально новое переработанное восьмипоточное ядро VT с утроенной линейной производительностью на один поток команд. Это ядро было разработано еще в 2007 году, и "в кристалле" оно появится во второй половине 2011 года. В T4 будет восемь ядер, а для увеличения поточной производительности микропроцессор должен будет иметь более высокие частоты, чем предусматривалось прежним планом, и вместо 2,5 ГГц, скорее всего, этот показатель составит примерно 4 ГГц.

Процессор SPARC T5 будет иметь 16 ядер (аналог Cascade Fall) и будет реализовываться по технологии 28 нм. Со временем Oracle планирует под семейство чипов SPARC T подстраивать все свои приложения, СУБД, стек связующего ПО и наоборот. Если возникнет потребность в повышении производительности, то приложение в многопоточном ядре процессора SPARC T может захватить поток (или группу), а не разделять ресурсы микропроцессора с другими потоками команд, причем низкоприоритетные приложения могут получить потоки по мере их освобождения. Все это даст Oracle преимущества при создании конкурентоспособных Unix-систем.

***

«Второе дыхание», обретенное архитектурой SPARC/Solaris в результате поглощения Sun Microsystems корпорацией Oracle, окажет большое влияние на рынок решений поддержки OLTP-приложений, на котором до сих пор господствовали большие вычислительные системы. Распределенная кластерная технология Supercluster позволяет строить высокопроизводительные недорогие системы для облаков, способных решать задачи из всего спектра коммерческих приложений.

Виталий Кузьмичев (vital@lynx.ru) — директор по развитию компании «Линкс» (Санкт-Петербург).