Далеко не каждому процессору Intel уготован тотальный успех с момента его появления на рынке и вплоть до почетного выхода на пенсию», да и Atom не относится к баловням судьбы. Дебют этого процессора пришелся на начало экономической смуты, однако одновременно с ним появился новый тип мобильных ПК – облегченные недорогие субноутбуки, или нетбуки, как их окрестили в Санта-Кларе. Это «совпадение», возможно, и предопределило дальнейший путь процессора Intel Atom.

Нетбуки сразу стали быстро набирать популярность, опережая первоначальные осторожно-оптимистичные прогнозы аналитиков, и, соответственно, объем продаж процессора Atom и чипсетов для него, по данным Intel, вырос с примерно 200 млн долл. в третьем квартале 2008 года до 415 млн долл. в третьем квартале 2009-го. Но скептики критиковали первое поколение Atom за недостаточно высокую производительность, отмечая «каннибализацию», вызванную им на рынке, – дескать, нетбуки «отъедают» долю у ноутбуков начального уровня.

Техасский проект

Процессор Atom был создан в Остине (шт. Техас) интернациональной командой разработчиков под руководством Эленоры Йоэли. Многие инженеры этой группы ранее работали над проектом под кодовым именем Tejas, о котором сохранились лишь скудные сведения – проект в итоге был свернут по причине отказа Intel от микроархитектуры NetBurst. Теперь перед ними стояла задача обеспечить совместимость на уровне инструкций с архитектурой x86 и всеми известными на тот момент ее расширениями в виде наборов инструкций типа SIMD (Single Instruction, Multiple Data), предложенными Intel, вплоть до SSSE3 (Supplemental Streaming SIMD Extension 3) – в рамках расчетного тепловыделения, или термопакета (Thermal Design Power) 0,6–2 Вт.

Надо сказать, все это было довольно жестким ограничением. Конечно, во втором полугодии 2007 года у корпорации появились два одноядерных 65-нанометровых мобильных процессора на основе микроархитектуры Intel Core с ультранизким напряжением питания (Ultra Low Voltage) и тепловыделением 5,5 Вт. Однако это были типичные нишевые продукты, в то время как Atom готовили к принципиально иной роли – расширять сферу применения платформы ПК за счет формирования новых классов устройств.

Но и 5,5 Вт – это в разы больше, чем ориентиры, установленные для создателей Atom, хотя у других мобильных процессоров на основе микроархитектуры Intel Core в графе TDP наименьшим в то время было вообще значение 10 Вт. А ведь Atom по производительности впоследствии сравнивали с «настольными» процессорами, имевшими тепловыделение порядка 45–65 Вт, и на основании этого сравнения делали вывод о его непригодности для офисных ПК.

Производительность будущего Atom в феврале 2008 года в тезисах к конференции ISSCC (International Solid-State Circuits Conference) характеризовалась как сопоставимая с типичной для ультрамобильных ПК (устройств, по размерам чуть больше коммуникаторов, но меньше субноутбуков; типичный пример того времени – проект Origami, ассоциировавшийся с Microsoft, Intel и Samsung). Это говорили о проекте под кодовым названием Silverthorne сами техасские разработчики, но уже в начале марта выяснилось, что созданная в Остине микроархитектура годится и для нетбуков, а с увеличением TDP до 4 Вт – и для их настольных собратьев, названных неттопами.

При первом взгляде на эту микроархитектуру (рис. 1) бросается в глаза то, что функциональные блоки процессора сгруппированы в кластеры. Что это – какая-то новая идеология, новый подход к проектированию процессоров? Или просто блоки сгруппировали по функционалу? В Intel уверяют, что никакого «сакрального смысла» эти кластеры не несут – процессоры разрабатываются поблочно, за отдельные куски работы отвечают разные команды, эти куски объединяются в логические структуры, которые и есть кластеры.

По словам разработчиков, база данных модулей FUB (Functional Unit Block) для Atom состоит из 205 позиций. Подавляющее большинство этих модулей (91%) выполнены на основе стандартных элементов и лишь 9% абсолютно уникальны. При этом чуть ли не каждый из модулей обладает функцией управления тактовым сигналом (clock gating) – весьма полезной с точки зрения энергосбережения. Atom, кстати, поддерживает режимы энергосбережения вплоть до Deep Power Down (C6), при котором отключается кэш-память обоих уровней. Для следующих поколений обещаны еще более глубокие режимы сна, а также дальнейшее улучшение управления питанием и снижение токов утечки.

Методология дизайна Atom получила название Sea of FUBs, и в результате ее реализации на свет появился процессор с 47 млн транзисторов, площадью кристалла 26 квадратных миллиметров (у недавно представленного двухъядерного варианта Atom 330 то и другое вдвое больше, а тепловыделение увеличено до 8 Вт) и девятью слоями металлизации. Из этих 47 млн транзисторов на долю исполнительной (логической) части, по неофициальным оценкам, приходится 13,8 млн, хотя в Intel эти оценки не подтверждают, отмечая, что здравому смыслу они не противоречат.

Процессоры Atom первого поколения выполнены по технологии 45 нм с использованием металлических затворов и материала с высокой диэлектрической проницаемостью (high-k) в качестве диэлектрика затвора. Вариант процессора для нетбуков и неттопов также известен как Diamondville, а сам проект Silverthorne получил воплощение в серии Atom Z, предназначенной для ультрамобильных ПК и еще более компактных устройств MID (Mobile Internet Devices), приближающихся по своим размерам к смартфонам. В 2008–2009 годах было выпущено в общей сложности около полутора десятков моделей Atom – с рабочей частотой процессорного ядра от 800 МГц (Atom Z500) до 2 ГГц (Atom Z550) и частотой внешней шины (FSB), варьирующейся в диапазоне 400–667 МГц.

Атомная логика

Одно из слабых мест Atom с точки зрения производительности – поочередное исполнение команд (In-Order Execution). Во многом, кстати, именно по этой причине среди экспертов поначалу бытовало мнение, что Atom является прямым потомком Pentium и Pentium MMX. Дело в том, что начиная с поколения Pentium Pro в процессорах утвердился механизм внеочередного исполнения команд (Out-of-Order Execution), и даже в VIA Nano, предназначенном, по сути, для тех же сфер применения, что и Atom, используется OOE. Выбор в пользу IOE позволил существенно упростить дизайн, сэкономив место на кристалле за счет отсутствия ряда функциональных блоков (в частности, буферов переупорядочения и механизмов контроля над порядком инструкций и восстановления их последовательности после обработки), и дал выигрыш по энергопотреблению. Однако в обмен на это пришлось пожертвовать производительностью.

Тем не менее кое-что от OOE в Atom все же имеется. Это алгоритм SIR (Safe Instruction Recognition), переставляющий вперед в процессе исполнения команд целочисленную инструкцию с малой задержкой в случае, если ей предшествующая требует длительного ожидания данных в формате с плавающей запятой (и если эти две инструкции не связаны друг с другом).

Появится ли со временем в процессорах Atom полноценная реализация OOE или будут совершенствоваться (и появляться новые) алгоритмы типа SIR? Однозначного ответа в Intel не дают, хотя некоторые эксперты считают, что в ближайшие три-четыре года в подлинный OOE-процессор Atom не превратится, но вполне возможно, что элементов OOE в нем станет больше.

За один такт Atom выдает на исполнение две микрооперации, соответственно у него есть два декодера инструкций, два блока целочисленных вычислений и два блока для работы с данными в формате с плавающей запятой и инструкций типа SIMD. Конвейер состоит из 16 стадий (на две больше, чем у Core 2 Duo).

Поскольку для IOE разбиение на микрооперации не столь критично, как для OOE, а также ввиду того, что конвейер у Atom сравнительно простой, большинство инструкций x86 может обрабатываться процессорным ядром в оригинальном виде. Это означает, что при определенных обстоятельствах работающий Atom даже может выглядеть как процессор, выполняющий более двух микроопераций за такт.

Технология Hyper-Threading поддерживается почти во всех моделях первого поколения Atom, кроме Atom Z510. В подавляющем большинстве моделей также имеется поддержка антивирусной технологии Executive Disable Bit, в некоторых – технологии виртуализации Intel VT, а в двух – 64-разрядного расширения Intel 64. В процессорах Atom, по словам представителей Intel, нет агрессивного спекулятивного выполнения команд, но есть предсказание ветвлений, а штраф за неправильное предсказание варьируется, по неофициальным источникам, от 13 до 17 процессорных циклов. Не так давно в одном из своих публичных выступлений Мули Иден, вице-президент Intel и генеральный менеджер подразделения PC Client Group, так описал принцип работы мобильного процессора будущего: «Он должен проснуться, быстро сделать работу и снова заснуть». Некоторые наблюдатели после этого пришли к выводу, что в Санта-Кларе собираются окончательно отказаться от спекулятивного выполнения команд в мобильных процессорах, поскольку это для них «лишняя работа». Однако в Intel отмели такое предположение, заявив, что модель «Проснулся – исполнил – заснул» и спекулятивное исполнение не являются взаимоисключающими.

Некоторое удивление у специалистов вызвал и несимметричный кэш первого уровня (L1) у Atom – 32 Кбайт для инструкций и 24 Кбайт для данных. Гораздо привычнее видеть у процессоров Intel (и не только) одинаковые объемы кэш-памяти L1, выделенные для инструкций и данных. Но кэш L1 у Atom отличается не только этим. В современных процессорах кэш-память обычно представляет собой память типа SRAM, ячейки которой состоят из шести транзисторов. Разработчиками Atom, по их словам, в целях уменьшения энергопотребления и времени доступа, а также повышения надежности был выбран другой тип SRAM – с ячейками, выполненными на восьми транзисторах. Таким образом кэш L1 увеличился по площади, и возникла гипотеза, что общая площадь кристалла из-за этого превысила заданные рамки. Поэтому, дескать, и пришлось несколько сократить кэш L1, сделав его несимметричным. Выглядит правдоподобно, хотя на деле вполне может оказаться излишним упрощением. Во всяком случае, в Intel гипотезу не подтверждают, ограничиваясь при этом общим объяснением, что несимметричность кэш-памяти L1 обусловлена «максимизацией энергоэффективности».

Кэш-память L2 у Atom выглядит более привычно – 8-канальная наборно-ассоциативная (кэш инструкций L1 – также 8-канальный, кэш данных L1 – 6-канальный), с контролем и коррекцией ошибок (in-line ECC), выполненная в виде стандартных ячеек SRAM c шестью транзисторами общей емкостью 512 Кбайт. Задержка при обращении в кэш L2, по данным независимых измерений, составляет 17–18 процессорных циклов (у процессоров на основе архитектуры Intel Core – 14–15 циклов, у 90-нанометровых Pentium M на основе ядра Dothan – 10 циклов), при обращении в кэш данных первого уровня – 3 цикла (аналогично Core 2 Duo и Dothan).

Курс на Medfield

Если попытаться одним словом охарактеризовать парадигму дальнейшего развития Atom, то слово это будет «интеграция». В первую очередь, конечно, следует сказать об интеграции с контроллером памяти и графическим ядром. По этому пути сейчас идут разработчики не только Atom, но и других процессоров Intel – в частности, мобильных (в рамках проекта под кодовым названием Arrandale) и настольных (проект Clarksdale, процессоры Core i3 серии 500 и Core i5 серии 600).

В последние месяцы перед официальным дебютом платформы нетбуков и неттопов Pine Trail и процессора под кодовым названием Pineview, сменяющего нынешние модели на ядре Diamondville (рис. 2), в открытых источниках в основном обсуждались сроки премьеры, которые то отдалялись, то вновь приближались. Сведений технического характера даже по неофициальным каналам просачивалось столь немного, что возникало ощущение их строгой дозированности. А на прямые вопросы о тех или иных характеристиках Pine Trail (или Pineview), адресованные представителям Intel, обычно следовал ответ: «На текущий момент мы не раскрываем детали платформы (процессора)». Кое-что обнадеживающее, впрочем, все же сообщалось. Причем, как ни странно, речь в основном шла не о повышении производительности, а о дальнейших улучшениях по части энергосбережения, которые на этот раз коснулись не только процессора, но и чипсета.

Первому поколению Atom с чипсетами не очень повезло. Для нетбуков был предложен набор системной логики Mobile Intel 945GSE, выпущенный одновременно с первыми процессорами на ядре Diamondville и представляющий собой модифицированную версию Mobile Intel 945GMS образца 2006 года (со сравнительно небольшими изменениями), с южным мостом ICH7M (также 2006 года). В комбинации с процессором Atom N270 или N280 с TDP 2,5 Вт эта конструкция выводила производителей нетбуков на системы с термопакетом 11,8 Вт, и тем нередко приходилось использовать кулеры (иногда – активные) для охлаждения. С неттопами дело обстояло примерно так же – поддержка процессоров Atom 230 (TDP 4 Вт) и 330 (8 Вт) была возложена на чипсет Intel 945GС, представленный в первом квартале 2007 года, с южным мостом ICH7 (представлен в 2005 году). И с ним термопакет системы в целом составлял 29,5 либо 33,5 Вт.

Платформа Pine Trail с чипсетом Tiger Point (NM10), согласно предварительным данным, снижает показатель TDP для неттопов до 15 Вт, для нетбуков – до 7 Вт. Производителей нетбуков должна порадовать возможность использовать четырехслойные печатные платы (вместо нынешних шестислойных), что сокращает себестоимость. Отдельно подчеркивается, что для Tiger Point не требуется ни активное, ни пассивное охлаждение. Наконец, вследствие интеграции процессора с графическим ядром и контроллером памяти отпадает необходимость в северном мосте чипсета. Поэтому сокращается общая площадь контура поверхностного монтажа процессора и чипсета на материнской плате (footprint) – с 2174 (у нетбуков) либо 2601 (у неттопов) кв. мм до 773 кв. мм.

Производственный техпроцесс поначалу останется прежним – 45 нм для процессоров Pineview, 130 нм для чипсета Tiger Point. Не форсируют в Intel и увеличение числа ядер у Atom. В частности, в сегменте неттопов на смену одноядерному Atom 230 приходит также одноядерный Atom D410. То же самое с двухъядерными вариантами – Atom 330 уступает дорогу Atom D510.

Рабочую частоту ядра Atom в Intel увеличивают осторожно – первое поколение, стартовав с отметки 1,6 ГГц, в итоге добралось лишь до 2 ГГц. И у Pineview в этом плане начало тоже не слишком агрессивное. Чуть более активно просматриваются возможные варианты расширения сферы применения Atom. Недаром в ходе сентябрьского форума IDF (Intel Developer Forum 2009) в Сан-Франциско представители Microsoft пропагандировали идею использовать Atom в серверах. Правда, то были серверы для домашних сетей, хотя опыты такого рода не ограничиваются только ими.

Еще в большей степени слово «интеграция» характеризует развитие Atom применительно к платформам для ультрамобильных ПК и мобильных Internet-устройств. О процессоре Lincroft, составляющем основу платформы 2010 года под кодовым названием Moorestown (рис. 3), уже говорят как о продукте типа SoC (System on Chip) – «система на чипе». По большому счету это, конечно, преувеличение – если отталкиваться от классического определения SoC. Но в данном случае важнее тренд – по линии Silverthone, Lincroft и т.д. отчетливо виден уклон Atom в сторону SoC.

Помимо графического ядра и контроллера памяти (одноканальная DDR либо DDR2 с пониженным напряжением питания), 45-нанометровый процессор Lincroft также включает в себя аппаратный видеоускоритель и контроллер дисплея с интерфейсом DSI (Display Serial Interface), предложенным альянсом Mobile Industry Processor Interface (MIPI), либо LVDS (Low-Voltage Differential Signaling). Встроенное графическое ядро поддерживает интерфейсы OpenVG версии 1.0 (векторная графика 2D) и OpenGL ES версии 2.0 (3D-графика для встраиваемых приложений).

Второй основной компонент Moorestown – микросхема под кодовым названием Langwell, выполняющая роль чипсета для Lincroft. В Intel ее обозначают как I/O-PCH (Input/Output Platform Controller Hub). Она в свою очередь спроектирована под техпроцесс 65 нм, включает в себя аудиокодек и реализует поддержку карт расширения SDIO (Secure Digital Input/Output), флэш-памяти NAND, интерфейсов USB и CE-ATA, а также CSI (Camera Serial Interface), относящегося к компетенции MIPI Alliance. В качестве дополнительных элементов Moorestown фигурируют микросхема под кодовым названием Briertown с интегрированными функциями управления питанием и модуль под кодовым названием Evans Peak, обеспечивающий поддержку беспроводных коммуникаций (Wi-Fi, WiMAX, GPS, Bluetooth).

По словам представителей Intel, тактовая частота процессора Lincroft при необходимости может увеличиваться в течение короткого интервала времени, не оказывая влияния на тепловые характеристики системы. Так работает технология Intel BPT (Burst Performance Technology). Ранее она была реализована в процессорах Atom Z515. Также отмечается, что при работе процессора на повышенных частотах платформа Moorestown позволяет увеличивать пропускную способность шин и снижать задержки в шине, связывающей процессор с памятью (режим Bus Turbo Mode).

Рекомендуемый размер системных плат для устройств на платформе Moorestown, как заявили в Intel, сокращается вдвое по сравнению с платформой первого поколения Menlow (для которой он равен 8500 кв. мм). Также вдвое снижается энергопотребление в рабочем режиме и в 50 с лишним раз – в режиме простоя (1,6 Вт у Menlow, согласно данным Intel), в частности, за счет технологии power gating (аналогичной clock gating, но работающей с сигналом питания). В общем, все идет к тому, что ультрамобильными ПК и мобильными Internet-устройствами сфера применения процессоров Lincroft не ограничится.

О выпуске смартфонов на базе x86-совместимых процессоров как о реальной перспективе заговорили сразу же после официальной премьеры первого поколения Atom. Выяснилось, что для кого-то это было мечтой, для кого-то кошмаром. По словам представителей Intel, платформа Moorestown позволяет сделать это явью. А ведь за ней на горизонте появилась уже и платформа следующего поколения. Интерес к проекту под кодовым названием Medfield (одночиповое решение, техпроцесс 32 нм, премьера ожидается в 2011 году) пробудился после того, как в начале мая 2009 года в журнале Fortune вышла статья под названием «Секретный план Intel». В ней рассказывалось о загадочных процессорах для бытовой электроники и смартфонов, разработка которых ведется группой под руководством Эленоры Йоэли.

За два месяца до этого было заключено не менее загадочное соглашение между Intel и TSMC, согласно которому, в частности, была запланирована некая интеграция продуктов типа SoC в семействе Atom с интеллектуальной собственностью TSMC (тайваньские источники по традиции не упустили случая посудачить о предмете этой интеграции, полагая, что им станет Langwell). Через полтора месяца было заключено другое громкое соглашение – на этот раз с Nokia. И снова говорилось о разработке мобильных систем и лицензировании технологий (было упомянуто конкретное решение – модем HSPA/3G). Вкупе еще с одним соглашением (с LG Electronics), о котором было объявлено в феврале 2009 года, сложилась вполне ясная картина – в Intel действительно готовят Atom к тому, что в свое время не получилось сделать с процессорами XScale на ядре ARM. Смартфоны можно назвать вотчиной ARM – лицензиаты одноименной британской компании фактически делят этот рынок между собой и намереваются посягнуть на рынок нетбуков. Быть или не быть среди них? Или быть в одиночестве против многих? Этот выбор достоин вершителей судеб микроэлектронной индустрии. Конечно, вопрос мог и не стоять так жестко. И одиночество с учетом пресловутой экосистемы на подхвате, возможно, кому-то покажется надуманным. Так или иначе, но в Intel свой выбор сделали. И в результате этого выбора маленький техасский городок дал миру процессор, который столь же неисчерпаем, как и архитектура, его породившая.


Коротко о Moblin

В отличие от большинства других процессоров Intel, Atom вносит некоторое разнообразие в привычное распределение ролей в нерушимом тандеме Wintel. Конечно, в Санта-Кларе еще не зашли так далеко, чтобы открыто претендовать на полное замещение операционных систем Microsoft продукцией собственной разработки. Более того, как показывают опросы пользователей, многие из них считают именно ОС семейства Windows (сейчас – все чаще Windows 7) оптимальным вариантом для нетбуков, но тем не менее в Intel разработали свой вариант программной платформы с открытым кодом на основе Linux для нетбуков, мобильных Internet-устройств и прочего оборудования, относящегося к сфере интересов Atom. Платформа эта получила название Moblin, что обычно расшифровывают как Mobile Linux.

Первые сведения о Moblin относятся к середине 2007 года, и, по словам разработчиков, первая версия Moblin была в большей степени пробным проектом – неким набором технологий, который можно было использовать при оптимизации Linux-решений под платформу Intel. Версия 2.0, представленная в 2009 году, включает в себя полноценную ОС, готовую к использованию. В ноябре была выпущена версия 2.1, которую в Intel позиционируют в качестве программного сопровождения платформы Moorestown. В апреле 2009 года было объявлено о передаче проекта Moblin в ведение некоммерческой ассоциации Linux Foundation. Однако ключевую координационную роль в проекте по-прежнему играют специалисты Intel.

В своем нынешнем виде Moblin во многом напоминает проект Fedora – фактически это Linux-дистрибутив, работа над которым ведется в рамках некоего сообщества, за которым в свою очередь стоит известная корпорация. При этом открытость кода позволяет другим разработчикам и производителям устройств использовать Moblin в оригинальном виде, дополнять его своими разработками либо применять какие-то отдельные технологии. Центральным звеном Moblin является ядро Moblin Core – набор библиотек и сервисов приложений, включающий в себя такие компоненты, как базовая система графики, текстового рендеринга и оконного интерфейса, средства для создания пользовательских интерфейсов в классическом и 3D-стиле, клиентские и серверные библиотеки для управления персональной информацией, библиотеки для воспроизведения мультимедиафайлов (с поддержкой OpenGL), инструменты ускоренной загрузки ОС и управления питанием, сетевая подсистема и т.д. В свою очередь в основе Moblin Core лежит платформа GNOME Mobile, дополненная компонентами, оптимизированными для процессоров Atom, и библиотеками с открытым кодом, принадлежащими Intel. В число последних входят, в частности, библиотеки Clutter (3D-графика, физические модели и эффекты) и GUPnP (поддержка интерфейса Universal Plug And Play), разработанные в компании OpenedHand (в 2008 году вошла в состав Intel).