По оценкам инженеров Google, через три года с начала эксплуатации расходы на электроэнергию для работы сервера оказываются сопоставимыми с расходами на приобретение этого сервера. Энергопотребление стало одной из важнейших тем, обсуждавшихся в Сан-Франциско в ходе осеннего Форума Intel для разработчиков. От центров обработки данных, где от энергопотребления систем зависит размер счета за электричество, до мобильных систем, где оно напрямую влияет на время автономной работы, инженеры пытаются находить все новые пути повышения эффективности систем
Рост популярности Internet-сервисов вызвал рост количества серверов, необходимых для их функционирования. По словам директора по технологиям Intel Джастина Ратнера, еще несколько лет назад разработчики решали задачу, как обеспечить показ тысячи Internet-страниц в час, а сегодня такие сайты, как Yahoo, показывают своим пользователям миллиарды страниц в день. По некоторым оценкам, количество серверов в ближайшие пять лет увеличится в девять раз, а объем генерируемого ими трафика — в пять, при этом к 2010 году четверть серверов будет устанавливаться в центрах обработки данных, состоящих из более чем 100 тыс. машин.
«Сегодня не так уж и странно разговаривать о центрах обработки данных с 10 тыс. процессоров или с 50 тыс. и более, — сказал он, — но это лишь вершина айсберга».
По мнению ведущего инженера Google Луиза Баррозо, несмотря на то что современные процессоры обладают гораздо большей производительностью в расчете на ватт потребляемой энергии, проблему энергоэффективности следует рассматривать на уровне всей системы, куда входят такие компоненты, как память, подсистема ввода/вывода, система охлаждения и подачи электроэнергии.
По словам директора по технологиям Intel Джастина Ратнера, еще несколько лет назад разработчики решали задачу, как обеспечить показ тысячи Internet-страниц в час, а сегодня такие сайты, как Yahoo, показывают своим пользователям миллиарды страниц в день |
«Некоторое время назад мы составили профиль потребления электроэнергии и поняли, что здесь есть ряд интересных возможностей, одна из них связана с самими блоками питания, — сказал он. — Если посмотреть на сегодняшний настольный ПК или сервер начального уровня, то, вероятнее всего, в нем будет установлен блок питания, который работает с КПД от 55 до 70%. Это означает, что блок питания может оказаться тем компонентом системы, который потребляет наибольшее количество энергии».
Одно из решений, к которым пришли в Google, заключается в упрощении схемы блоков питания. Сейчас они подают напряжение 12,5 и 3,5 В, но если бы они работали с напряжением только 12 В, то их КПД увеличился бы до 90%.
«Но ловушка здесь заключается в том, что для введения подобных стандартов необходимо сотрудничество с Intel и сообществом разработчиков, — сказал Баррозо. — Нам нужно создать открытые стандарты, которые сделали бы эти возможности общедоступными».
В Intel также вели исследования, посвященные энергоэффективности на уровне центра обработки данных. Многочисленные преобразования напряжения приводят к снижению КПД не только в блоке питания сервера, но и в системе энергообеспечения центра обработки питания в целом.
Сначала переменный ток с напряжением 480 В (речь идет об американском стандарте, однако тот же самый принцип можно переложить и на российский стандарт энергоснабжения) поступает в источник бесперебойного питания, где преобразовывается в постоянный ток, а затем — снова в переменный. На распределительном щитке переменный ток с напряжением 480 В преобразовывается в переменный ток с напряжением 208 В. И уже в блоке питания — в постоянный с напряжением 12 В.
«Если бы у нас был способ сократить количество преобразований, то мы смогли бы увеличить КПД», — предположил Ратнер.
Идея, предлагаемая Intel, заключается в преобразовании входного напряжения на источнике бесперебойного питания в 360 В постоянного тока, которое проходило бы распределительный щиток без преобразований, а в блоке питания конвертировалось в стандартные 12 В постоянного тока.
В Intel полагают, что перевод центра обработки данных на постоянный ток позволит сэкономить 14% потребляемой мощности за счет исключения преобразований. По данным компании, при использовании новой схемы подачи энергии число серверов может быть увеличено на 60% при той же мощности, что равноценно 600 дополнительным серверам на 1 мВт.
В сегменте портативных устройств также ведется борьба за снижение энергопотребления. Здесь сокращение потребления на 1 Вт дает 25-30 дополнительных минут автономной работы. В ближайшее время в ноутбуки придет ряд новых технологий, позволяющих сэкономить драгоценные милливатты.
Одна из них — Robson — появится в новой мобильной платформе Santa Rosa, выход которой запланирован на первое полугодие 2007 года. Эта технология предлагает использовать в качестве кэша для данных, хранящихся на жестком диске, флэш-память. Помимо ускорения загрузки операционной системы и увеличения скорости доступа к данным, она сокращает нагрузку на жесткий диск, что дает 400 мВт экономии энергии.
Другая технология разрабатывается совместно с компаниями Toshiba и Matsushita. Она позволяет переключать режим развертки дисплея из прогрессивного (progressive) в чересстрочный (interlaced) в то время, когда на нем не воспроизводится видео. Экономия при ее использовании должна составить от 200 до 400 мВт, в зависимости от размера экрана.
С точки зрения сокращения энергопотребления, возможности, заложенные в Santa Rosa, не ограничиваются применением флэш-памяти NAND.
В новой платформе Intel увеличила частоту системной шины с 667 до 800 МГц, однако, аналогично технологии, примененной ранее в процессорах, ее частота будет динамически изменяться в зависимости от вычислительной нагрузки. В режиме «бездействия» (deep sleep) ядро процессора также стало потреблять меньше энергии за счет изменений, внесенных в алгоритм работы чипсета.
Когда процессор переходит в этот режим, он освобождает кэш и переключается на низкое напряжение, однако, если приходит запрос на наличие данных в кэше, процессору необходимо «проснуться», чтобы дать ответ, что кэш пуст. В Santa Rosa чипсет сигнализирует о состоянии кэша и не пробуждает процессор, что позволяет дольше сохранять его в режиме deep sleep.
Готовимся к SSE4
В 64-разрядных процессорах Intel, произведенных по 45-нанометровому техпроцессу, будет использоваться 50 новых инструкций — такое заявление сделал старший вице-президент Intel и генеральный менеджер Digital Enterprise Group Патрик Гелсингер в ходе осеннего Форума Intel для разработчиков в Сан-Франциско. Новые инструкции, объединенные в набор SSE4, предназначены для ускорения работы с мультимедиа, текстовыми данными, а также рядом конкретных приложений. Известно, что в их разработке принимали участие Adobe и Microsoft.
В каждом следующем поколении наборов инструкций Intel оптимизирует выполнение старых под новую микроархитектуру и представляет новые инструкции, ускоряющие работу новых приложений. И, чтобы использовать новые возможности в старых приложениях, их нужно перекомпилировать.
Нововведение, о котором шла речь на IDF, является самым существенным с декабря 2000 года, когда Intel представила набор SSE2 (144 инструкции, расширившие наборы SSE и MMX) для 180-нанометровых процессоров. В феврале 2003 года еще 13 инструкций было включено в состав SSE3 и впервые использовано в 90-нанометровых процессорах, а в июле уже этого года для 65-нанометровых чипов (Xeon 5100 и Core 2 Duo) был представлен набор из 32 вспомогательных инструкций.
Значительная часть новых инструкций предназначена для ускорения векторизации приложений компилятором и работы с мультимедиа-данными, что, как ожидают разработчики, даст существенный прирост производительности при обработке изображений, графики, видео, работе программ двух- и трехмерного рендеринга и других приложений, требующих большого объема оперативной памяти.
Отдельную группу составляют четыре инструкции по работе со строковыми данными, позволяющими осуществлять операции множественного сравнения и поиска, заменяя сразу несколько инструкций, которые нужно было выполнить раньше. Прирост производительности от этого нововведения будет ощущаться в антивирусных и поисковых приложениях, СУБД.
Наконец, в SSE4 введены две новые специализированные инструкции по проверке целостности данных (CRC) и поиску на основе большого массива данных. Первая позволит ускорить работу сетевых протоколов iSCSI и RDMA (Remote Direct Memory Access), где механизм CRC играет важную роль при обнаружении ошибок, но при этом является узким местом. Второе расширение позволит ускорить выполнение приложений в области здравоохранения и распознавания рукописного текста.
Последние два расширения представляют совершенно новую тенденцию в развитии микроархитектуры Intel, когда процессор начинает выполнять на уровне машинных команд операции, специфичные для конкретных приложений. Ожидается, что с переходом на 32-нанометровый техпроцесс и ростом числа транзисторов на кристалле число поддерживаемых специальных инструкций будет увеличиваться.
На сегодняшний день известны только общие характеристики SSE4. По словам Гелсингера, информация о конкретных машинных командах появится после того, как компания выпустит работающие образцы 45-нанометровых процессоров.