Компьютер-кубик будущего |
Со времен, когда на печатных платах из фибергласса вручную паяли провода, триоды, диоды, сопротивления, и вплоть до нынешнего времени, когда на кремниевых подложках собирают миллиарды транзисторов, конструкции компьютеров остаются объединенными одним общим свойством — в них все на плоскости. На уровне чипов — планарные технологии, а далее чипы собираются на многослойных печатных платах, и только на уровне стойки появляется объем. Так было, есть, но не всегда будет — неумолимость закона Мура рано или поздно приведет к нарушению многолетней традиции, и чипы станут трехмерными (3D IC), что приведет к радикальным изменениям в проектировании компьютеров, все составляющие которых будут собраны в кубик (см. рисунок).
Осенью 2013 года состоялась конференция IEEE 3D IC, на которой отмечалось, что в силу серьезных технологических сложностей переход в третье измерение происходит медленнее, чем предполагалось, хотя главный стимул к такому переходу — сокращение энергопотребления — становится все актуальнее. В нынешних конструкциях электроника потребляет около 30%, а остальное приходится на сами серверы, и 3D IC потенциально могут изменить это соотношение. Уменьшение размеров проводников позволяет сократить задержки и повысить производительность, ослабив остроту проблемы бутылочного горла между процессорами и памятью. Однако высокая стоимость 3D IC служит препятствием, которое со временем будет преодолено в силу того, что речь идет об инженерных проблемах, а с точки зрения физики полупроводников ограничений нет.
Переход в третье измерение — явление принципиально новое, но и у него есть корни, и разумнее всего рассматривать происходящее как продолжающийся процесс интеграции, который начался с первых интегральных микросхем, затем продолжился в больших интегральных микросхемах (БИС) и в микропроцессорах. После них на некоторое время процесс интеграции стабилизировался в связи с изменением технологических параметров, а качество добавлялось за счет роста плотности кристаллов и печатных плат. Произошло разделение труда: одни компании выпускают процессоры, другие — память, третьи — сигнальные процессоры, четвертые — аналоговые компоненты и т. д. Каждый производитель сосредоточен на своем продукте и использует технологию, дающую оптимальное соотношение цена/качество, но есть и оборотная сторона этого процесса — платы получаются большими и с неоправданно высоким энерговыделением. Поэтому в начале 90-х годов появились первые мультифункциональные чипы (Multi-Chip Module, MCM).
Сначала MCM представляли собой исключительно цифровые устройства, но спустя какое-то время на одной подложке с ними стали собирать и аналоговые компоненты. После 2000 года возникло два варианта систем, интегрированных на одной подложке. В первом вся система интегрирована на одном кристалле (System-on-Chip, SoC) и системы размещаются в одном корпусе (System in a package, SiP). Во втором варианте на одной подложке собрано несколько кристаллов с разной функциональностью, образующих одну интегрированную систему, и сейчас подобные системы можно обнаружить во всех мобильных устройствах, однако для получения более сложных систем нужно решить задачу связи в SiP отдельных кристаллов. Решением стал своего рода аналог многослойной печатной платы, но уменьшенной до размеров кристалла и содержащей существенно больше элементов. Такая идея реализуется в интегральных схемах 2.5D Integrated Circuits (2.5D IC), в которых роль миниатюрной материнской платы играет кремниевый слой — интерпозер (interposer), представляющий собой промежуточную пластину с многослойными горизонтальными проводниками, соединенными вертикальными токопроводящими штырями. Такой способ межслойного соединения получил название Through-Silicon Vias (TSV) — «стержни, пронизывающие кремний»; на одной подложке можно разместить 10 тыс. и более таких стержней. Технология 2.5D IC была так названа, поскольку кристаллы располагаются на подложке в один слой, а интерпозер может быть многослойным, то есть в нем реализуется трехмерная структура межсоединений.
От 2.5 D всего один шаг до 3D, который обеспечивает тот же интерпозер, причем умозрительно все выглядит просто — достаточно сложить подложки с нанесенными между ними кристаллами в стек и обеспечить соединение между ними. В действительности же одной из ключевых становится проблема теплоотвода, которая так или иначе решается размещением теплопроводящих слоев, а геометрически все разнообразие решений сводится к вертикальной сборке чипов в стек (chip stacking), где имеется великое разнообразие способов соединения между слоями.
Наиболее продвинутой с практической точки зрения остается технология TSV, предполагающая послойное наложение кристаллов один на другой (3D wafer-level chip packaging). Например, чипом памяти можно накрыть чип CPU, в таком случае расстояния сокращаются на порядок и, как следствие, больше возрастает производительность и снижается энергопотребление. Создание 3D-чипов методом наложения — не столько научная, сколько инженерная задача, поэтому ее активно решают фирмы — производители оборудования для производства микросхем. Наука начинается с альтернативных подходов к передаче данных между слоями, и тем более серьезной задачей является создание монолитных трехмерных кристаллов. В 2012 году компания Applied Materials, основной поставщик технологической оснастки для корпорации Intel, совместно с несколькими сингапурскими научными организациями создала центр по передовым технологиям сборки чипов. Одновременно известный производитель памяти компания Micron Technology инициировала организацию консорциума Hybrid Memory Cube Consortium с участием Samsung, IBM, ARM, HP, Microsoft, Altera и Xilinx для продвижения своей технологии гибридного куба памяти Hybrid Memory Cube (HMC).
На сегодня имеется три основных варианта практической реализации TSV:
- Если количество слоев ограничено двумя-тремя, то применяется подход, заимствованный из 2.5 D, когда нижний слой подсоединен непосредственно к интерпозеру, а верхние подключаются к нему внешними проводниками.
- Если 3D-чип представляет собой стек одинаковых чипов (например, это может быть память), то достаточно каждый слой снабдить своим интерпозером и соединить их шинами, проходящими по внешним сторонам стека.
- Если же необходимо собрать в стек много различных чипов, то требуется обеспечить прямое взаимодействие между слоями с использованием технологии TSV.
Технология TSV внедрена компанией Micron в памяти HMC, а компанией Samsung — в кэш-памяти с вертикальной интеграцией V-NAND. На уровне разработок TSV присутствует и у других производителей — например, к получению практических результатов близки IBM и 3M, совместно разрабатывающие клеящую субстанцию, которая позволит собрать стек, состоящий из большого количества кристаллов. Таким образом, можно отказаться от существующих десятки лет материнских плат и собрать до 100 и более разнородных компонентов в один общий вертикальный массив. Однако при всех достоинствах у TSV есть один непреодолимый недостаток — эта технология построена на прецизионной механике, требует высочайшей точности, и естественно, что ведутся поиски альтернативных решений на электромагнитах или оптических принципах.
Компания ThruChip Communications предложила бесконтактный способ взаимодействия между слоями в стеке ThruChip Interface (TCI), то есть «интерфейс через чип», который, как утверждается, технологически проще и на 40% дешевле, чем TSV. На должность генерального директора компании приглашен Дэйв Дитцел [1], в прошлом руководитель отдела передовых исследований Sun Advanced Systems Group. Он стал звездой, создав в 1995 году компанию Transmeta, которая спроектировала процессор Crusoe и его преемник Efficeon, ставшие предвестниками Intel Atom. В продуктах Transmeta была реализована архитектура c очень длинной машинной командой (Very Long Instruction Word, VLIW) — у Crusoe это 128 разрядов, а у Efficeon в два раза больше. Для совместимости с архитектурой x86 использовалась технология морфинга программного кода со специальной логикой, интегрированной в процессор и выполняющей преобразование «на лету».
Идеологом проекта TCI стал японский профессор Тадахиро Курода, более известный как автор проекта «Розеттский камень» по созданию памяти, способной хранить данные тысячелетиями, чтобы потомки смогли прочесть послания его современников. От камня Куроды технология TCI унаследовала способ включения крошечных катушек индуктивности в подложку на уровне процесса КМОП, что устраняет механические связи, но повышает требования к точности согласования катушек между слоями. С помощью индуктивной связи можно передавать данные, но для подачи питания по слоям сохранятся омические связи. Теоретически TCI дешевле, чем TSV, и ближе к стандартным процессам КМОП.
Большие перспективы имеют оптические методы передачи данных между слоями, которыми занимаются в том числе и в России [2].
Вершиной интеграции являются монолитные трехмерные чипы — активные исследования в этом направлении ведутся в Стэнфордском университете, и первой к их коммерциализации подошла компания MonolithIC 3D, возглавляемая известным ученым и предпринимателем Цви Ор-Бахом.
Если говорить о практических шагах, то нужно прежде всего упомянуть о том, что в декабре 2013 года Micron Technology представила первые опытные экземпляры 2 GB HMC, имеющие емкость 2 Гбайт и различающиеся по пропускной способности канала: больший пор размеру (31 мм x 31 мм) поддерживает скорость 160 Гбайт/с, меньший (16 мм x 19,5 мм), предназначенный для компактных устройств, поддерживает вдвое меньшую скорость. Эти образцы имеют гораздо более высокие показатели, чем DDR3, — скорость обмена с центральным процессором в 15 раз выше, потребление энергии на 70% ниже при существенно меньшей задержке, в то время как показатели RAS (Reliability, Availability Serviceability) заметно выше.
В кубе HMC реализована четырех- или восьмиуровневая технология TSV. Физически HMC состоит из 4 или 8 слоев, разделенных на «камеры хранения». Данные распределяются по 16 камерам, управляемым одним общим для них контроллером. Скорость обмена с одной камерой равна 10 Гбайт/с, они работают параллельно, поэтому суммарная скорость в 16 раз выше.
***
Сегодня кажутся монстрами компьютеры, выпущенные несколько десятков лет назад, но еще через десяток-другой лет такими же монстрами будут казаться нынешние ЦОД, потребляющие сотни мегаватт. И этот прогресс будет возможен благодаря трехмерной электронике.
Литература
- Леонид Черняк, Закон Амдала и будущее многоядерных процессоров // Открытые системы. — 2009. — № 04. — C. 48–50. URL: http://www.osp.ru/os/2009/04/9288815 (дата обращения 18.04.2014).
- Edward Kostsov, Sergey Piskunov, Mike Ostapkevich, 3D ICS with Optical Interconnections. URL: http://www.intechopen.com/books/optical-communication/3d-ics-with-optical-interconnections (дата обращения 18.04.2014).
Леонид Черняк (osmag@osp.ru) — научный редактор, «Открытые системы. СУБД» (Москва).