Последнее десятилетие развития физики полупроводников привело к исключительно серьезным переменам в жизни человека. Впечатляющий прогресс проявляется во все более широком распространении распространении разнообразных портативных электронных устройств.

Впечатляющий прогресс проявляется во все более широком распространении сотовых телефонов и голосовой почты, в удаленном доступе, в расширяющемся применении портативных компьютеров и PDA, видеоплейеров, видеокамер и систем, связанных с использованием Internet.

В основе функционирования многих этих устройств лежит концепция цифровой обработки сигнала (digital signal processing, DSP).

Особенности современных DSP-архитектур

DSP-процессоры используются для непрерывной обработки сигналов, следующих в режиме реального времени. Сфера применения таких устройств разительно отличается от применения других процессоров. В DSP-процессоре интервал времени, необходимый для завершения операции, должен быть определен очень точно. Иными словами, вероятность прерывания обработки сигнала должна быть сведена к нулю: любую функцию, которая может привести к прерыванию операции, следует либо исключить, либо изменить, чтобы прерывания не произошло. Это предопределяет весьма существенные отличия архитектуры таких устройств от «обычных» процессоров.

Между тем DSP-процессоры все чаще начинают выполнять некоторые типичные функции микроконтроллеров или даже RISC-процессоров. Среди архитектурных особенностей нынешних DSP-процессоров можно отметить прямой доступ к памяти, поддержку возможности интегрирования разных видов устройств ввода/вывода, два уровня кэш-памяти. Но, пожалуй, самое современное решение в области DSP-процессоров связано с использованием архитектуры, допускающей употребление очень длинных командных слов (very large instruction word, VLIW). Удивительно, но, как только несколько лет назад такое решение было внедрено в ядро DSP-процессора компании Texas Instruments, его быстродействие возросло сразу на порядок. Быстродействие современных DSP-процессоров измеряется миллиардами операций в секунду.

Если же VLIW-архитектура поддерживается еще и адекватно настроенным компилятором, то функционирование DSP-процессора может стать не только исключительно эффективным, но и предельно простым. Поэтому в настоящее время наметился крен в сторону программного конструирования DSP-архитектур. Это ведет к дальнейшему увеличению быстродействия, причем такой инструментарий становится доступным все большему числу программистов. Последние, очевидно, довольны тем, что могут использовать меньшего размера программный код, поскольку команды — одиночные, с множественными данными и переменной длины — могут быть упакованы в одно слово.

Еще один плюс VLIW-архитектуры заключается в том, что она обеспечивает параллелизм двух видов — параллелизм выполнения операций умножения с накоплением и параллелизм шин. Это позволяет еще более увеличить быстродействие, так как подсистема памяти проектируется с учетом производительности ядра, а компилятор теперь может эффективно поддерживать конвейерную структуру с массовым параллелизмом. Конечно, архитектура DSP-ядра слишком сложна, чтобы можно было просто добавлять магистрали данных по мере наращивания модулей, однако будущее DSP-процессоров в значительной мере связывается сегодня именно с такой возможностью масштабирования в целях дальнейшего увеличения быстродействия.

Недалекое прошлое и недалекое будущее

Потенциал DSP-процессоров стал всерьез рассматриваться разработчиками два десятилетия назад. Так, в 1982 году DSP-процессор, реализованный на 50 тыс. транзисторах, обладал быстродействием 5 млн. операций в секунду при энергопотреблении 150 мВт на 1 млн. операций в секунду и стоил 150 долл. Спустя 10 лет количество транзисторов увеличилось на порядок, быстродействие возросло в восемь раз, потребляемая мощность сократилась более чем вдвое, а цена уменьшилась вдесятеро. К середине 90-х годов DSP-процессоры достигли уровня цен, рабочих характеристик и потребления энергии, допускающих их массовое применение. Их производство стало крупносерийным. Тогда же сложились новые рынки, в том числе ориентированные на Internet или на беспроводные приборы, которые потребовали использования гораздо более быстродействующих устройств. Налицо классический пример своевременного появления именно той технологии, которая необходима.

В компании Texas Instruments предсказывают, что в следующем году появится DSP-процессор, который будет содержать 5 млн. транзисторов, обладать быстродействием в 5 млрд. операций в секунду, энергопотреблением всего 0,1 мВт на 1 млн. операций в секунду и стоить всего лишь 1,5 долл. Подобные микросхемы изготавливаются на кремниевых пластинах диаметром 300 мм, тогда как 20 лет назад использовались 75-миллиметровые. К 2010 году, также согласно оценкам экспертов Texas Instruments, будет реализован DSP-процессор на 50 млн. транзисторов, при этом будет использоваться кремниевая пластина диаметром 400 мм, а нормы проектирования составят всего 0,02 мкм. Быстродействие устройства составит 50 млрд. операций в секунду, тактовая частота — 10 ГГц, потребляемая мощность 0,001 мВт на 1 млн. операций в секунду, а цена — 15 центов. Можно, конечно, усомниться в достижимости столь фантастических параметров, но, как свидетельствует вся история микроэлектроники, какими бы «безумными» ни были прогнозы, реальность всегда их превосходит.

Сетевые процессоры

Удивительно, но еще пару лет назад самого термина «сетевые процессоры» не существовало. Однако именно в это время более 20 компаний приступили к разработке подобных архитектур. Основные задачи сетевых процессоров — классификация, манипуляция и идентификация пакетов данных, управление таблицами просмотра и очередью. О масштабности возлагаемых на сетевые процессоры задач свидетельствует уже само наличие разнообразных сетей — глобальных, локальных, корпоративных, общедоступных, по которым передается информация разной природы. Виды каналов связи также разнообразны — медные, коаксиальные, волоконно-оптические, инфракрасные, радио... И при этом обязательным является требование высокой скорости передачи данных.

Сетевые процессоры отличаются исключительной сложностью. Пожалуй, самый характерный пример — сетевой процессор C-5 Digital Communication Processor компании C-Port, в состав которого входят 16 RISC-процессоров, 32 процессора обработки последовательных данных, 5 сопроцессоров и внутренняя шина со скоростью передачи данных 60 Гбайт/с. Естественно, сетевые платформы часто создаются с использованием собственного опыта разработки интегральных схем и универсальных процессоров. Например, корпорация IBM в качестве младших моделей процессоров для оборудования локальных и глобальных сетей предлагает RISC-процессор Power PC. В Motorola предполагают интегрировать будущие версии сетевого процессорного ядра C-5 с RISC-ядрами Power PC. Компания Analog Devices предложила новую линию процессоров AD6x89 для оборудования глобальных сетей, в состав которых входит масштабируемый процессор защиты данных, процессор глобальных сетей, контрольный процессор — и все эти устройства созданы на базе 125-мегагерцевого RISC-процессора; кроме того, имеется 32-разрядная шина обмена данными.

Не обходит своим вниманием рынок сетевых процессоров и корпорация Intel, которая начиная с 1997 года приобрела два десятка фирм, специализировавшихся в создании интегральных схем для сетевого и телекоммуникационного оборудования. В частности, два года назад состоялась одна из крупнейших сделок в отрасли схемотехники, когда Intel за 2,2 млрд. долл. купила компанию Level One Communications, известную своим опытом в создании аналоговых схем и схем со смешанной обработкой сигналов для сетевых процессоров. IXP1200, базовая модель сетевого процессора Intel, в настоящее время имеет шесть 200-мегагерцевых RISC-ядер, организованных на основе архитектуры StrongARM. Этот программируемый сетевой процессор способен обрабатывать 3 млн. пакетов в секунду. В 2001 году выпущено еще две версии процессора — IXP1240 и IXP1250.

Еще немного о сетях

Все более проявляется тенденция к размещению средств доступа к сети не на пользовательском конце, а со стороны Internet-провайдеров или корпоративных шлюзов. Это то, что называется удаленным доступом. Сервер удаленного доступа содержит множество модемных портов, каждый из которых может быть подключен к конкретному пользователю. До сих пор, однако, аналоговые интегральные схемы входят практически в каждый персональный компьютер, и в такой ситуации рынок традиционных пользовательских модемов, где прибыль не превышает 10%, становится невыгоден. Поэтому и завоевывают популярность программные модемы, где цифровую обработку сигнала и функции управления осуществляет центральный процессор. Примечательно, что темпы роста рынка программных модемов даже выше, чем для других DSP-решений. Рынок средств удаленного доступа куда выгоднее — более высокие доходы и менее жесткая конкуренция. Здесь открываются прекрасные перспективы для интегрированной передачи голоса и данных посредством протоколов, подобных Voice over IP.

Texas Instruments, Lucent, Motorola, Intel значительное внимание уделяют решениям в области голосового ввода. Последняя год назад продемонстрировала платформу голосового доступа в Internet, названную Voice Portal Platform; эта платформа основана на технологиях непрерывной обработки речи, разработанной в Dialogic, дочерней компании Intel. Этим в Intel не ограничились и в своем стремлении составить конкуренцию Texas Instruments начали поставки программируемого DSP-процессора IXS1000, который обеспечивает работу с голосом и данными в Internet. Процессор работает совместно с 8-портовым магистральным интерфейсом и 8-портовой схемой задания кадров.

Но и на этом Intel не успокоилась: совместно с IBM ведутся работы, имеющие своей целью создание беспроводных приборов следующего поколения, а именно разрабатываются стандартные программно-аппаратные средства для Internet-систем. При этом IBM предоставит встраиваемые микропроцессорные средства для устройств на базе архитектуры Intel Personal Client Architecture, а также инструментарий для StrongARM и будущих процессоров на основе микроархитектуры Xscale. Сама же IBM разработала эталонную Internet-приставку Power PC Internet Appliance Platform.

Встроенные применения

DSP-процессоры оказываются исключительно важным подспорьем в разнообразных встроенных применениях. Так, только продажи DSP-процессоров для контроллеров дисководов в прошлом году составили 0,5 млрд. долл.; примерно на такую же сумму продано и схем для управления функциями цифрового канала считывания. Плотность записи на магнитных дисках ежегодно увеличивается более чем на 60%, что намного превосходит темпы, определяемые законом Мура. Поэтому, разумеется, требуются и более быстрые процессоры и более сложные алгоритмы управления. Основной поставщик DSP-процессоров для контроллеров дисковых накопителей — все та же компания Texas Instruments. Намного отстают от нее Cirrus Logic, IBM, NEC и STMicroelectronics. На рынке схем для управления функциями канала считывания безусловным лидером является Lucent.

Еще один перспективный сегмент рынка — аудиоаппаратура и средства профессиональной звукозаписи. Так, компания Toshiba выпускает серию DSP-процессоров для поддержки различных форматов сжатия сигнала, используемых в телевизорах, портативных аудио- и DVD-плейерах. Наиболее известен процессор TC9446F-004, предназначенный для декодеров сигналов в популярном в Сети MP3-формате. DSP-процессоры находят применение в медицинских приложениях, в слуховых аппаратах, в стимуляторах сердечной деятельности, в том числе и таких, которые способны работать с использованием Internet. Наконец, без DSP-процессоров нельзя представить и электронные книги.

Итого

Рынок сетевых процессоров пока невелик. В соответствии с данными IDC, его оборот в 2000 году «не дотянул» и до 60 млн. долл. В 2001 году, как ожидается, продажи сетевых процессоров превысят продажи процессоров универсальных, предназначенных для использования в сетевом оборудовании. Однако продажи специализированных и стандартных интегральных схем, использующихся в сетях, пока превышают объем продаж сетевых и универсальных процессоров, вместе взятых. Вместе с тем, по данным IDC, продажи сетевых процессоров в 2003 году превысят 550 млн. долл. Еще более оптимистичны аналитики Cahners In-Stat Group, утверждающие, что к 2004 году этот рынок вплотную приблизится к отметке в 3 млрд. долл.

Рынок DSP-процессоров в настоящее время в целом не просто стабилен, но, как свидетельствуют данные аналитических компаний WSTS и IC Insight, характеризуется устойчивым ростом в стоимостном и в натуральном выражении. Объем продаж достиг 7,86 млрд. долл. (1,1 млрд. шт. в натуральном выражении). Неуклонно падает цена: если в 1995 году она составляла в среднем 12,9 долл., то сейчас — всего лишь 6,8 долл. Согласно прогнозу, через три года объем продаж достигнет 14,6 млрд. долл. (2,2 млрд. шт.), причем цена несколько замедлит свое падение и составит около 6,5 долл.

Важно отметить, что рынок DSP-процессоров обычно растет быстрее рынка интегральных схем. Например, в 1995 году среднегодовой прирост для этих рыночных сегментов составил 51% и 32%, в 1997 — 34% и 4%, а в 2000-м — 22% и 19% соответственно.


Перспективы рынка DSP-процессоров

Конечно, вне конкуренции был и остается рынок процессоров для средств связи. Доля этого сектора в общем рынке DSP-процессоров неуклонно возрастает и начиная с этого года превысит 50%. Главной движущей силой развития остаются беспроводные системы связи. Основными разработчиками и изготовителями DSP-процессоров для этих систем являются компании Texas Instruments, Lucent, Motorola, Conexant (ранее Rockwell Semiconductor Systems). Все они начинают активно осваивать рынок систем мобильной связи третьего поколения, обеспечивающих широкополосную высококачественную передачу больших объемов данных и речевой информации, а также поддержку мультимедийных средств.

Texas Instruments

Эта компания является крупнейшим производителем DSP-процессоров (более 41% мирового рынка). Почти каждая новая ее разработка становится значительным шагом вперед в развитии технологий DSP. Сравнительно недавно выпущены первые три схемы на базе DSP-ядра TMS320C64x — TMS320C6414, TMS320C6415 и TMS320C6416, работающие на частотах до 600 МГц. Во всех этих устройствах используется VLIW-архитектура. Наиболее интегрированной является модель С6416, в состав которой входят сопроцессоры и интерфейсы, специально предназначенные для базовых станций третьего поколения.

Motorola

Наиболее известная разработка компании — процессор DSP56690, который поддерживает все известные системы стандартов CDMA, TDMA, все европейские и американские сотовые системы. В состав схемы входят ядро DSP56600 с тактовой частотой 100 МГц и 32-разрядный микропроцессор М210 семейства M-CORE, работающий на частоте более 50 МГц. В июне 2001 года на конференции по встраиваемым процессорам компания сообщила о разработке процессорного ядра Power PC следующего поколения; 32-разрядное RISC-ядро, оптимизированное для построения решений категории «система на кристалле», обладает частотой 800 МГц при энергопотреблении 3 мВт/МГц. Ядро площадью всего 6 кв. мм изготавливается по 0,13-микронной технологии. В двухканальной суперскалярной архитектуре используется 7-стадийный конвейер, но основной особенностью ядра является наличие прикладных процессорных устройств, предназначенных для выполнения расширенного набора команд Power PC Book E. Одно из таких устройств осуществляет цифровую обработку сигнала с быстродействием 1,6 млрд. операций умножения с накоплением в секунду.

Lucent Technologies

Процессор DSP16410 предназначен для стационарных станций беспроводных систем третьего поколения. В его состав входят два ядра серии DSP1600 и оперативное запоминающее устройство емкостью 3 Мбит, что обеспечивает значительную гибкость в выборе типа программного обеспечения цифровой обработки сигнала. Эффективно обрабатывать сигнал помогает контроллер прямого доступа к памяти, а за обработку данных отвечают усовершенствованные интерфейсы большой пропускной способности. Процессор может быть использован в оборудовании различных стандартов передачи голоса и данных, в том числе разного рода вариантах CDMA и TDMA.

Star Core

Этот проект совместного технологического центра был задуман компаниями Lucent Technologies и Motorola с целью пошатнуть позиции Texas Instruments. Основанием для объединения усилий послужило то обстоятельство, что Motorola и Lucent имеют 36% рынка DSP-процессоров (напомним, Texas принадлежит 41%). Совместными усилиями была создана DSP-архитектура, используемая в схемах обеих компаний.

Около двух лет назад было создано DSP-ядро SC100-SC140, которому требуется сила тока 0,1 мА на млн. операций в секунду при тактовой частоте 300 МГц и напряжение 1,5 В. При работе в условиях, где необходимо исключительно низкое напряжение питания, SC140 может работать и при 0,9 В на тактовой частоте 120 МГц. Ядро располагает средствами параллельной обработки — четырьмя устройствами умножения с накоплением данных, четырьмя устройствами группировки разрядов, двумя арифметическими устройствами адресации и четырехступенчатым конвейером. Архитектура SC140 предусматривает применение наборов команд переменной длины. Подобная технология позволяет осуществлять одновременно несколько 16-разрядных команд за один цикл. Ядро SC140 допускает сопряжение с другими микроконтроллерными или DSP-ядрами, а также с самопрограммируемыми сопроцессорами. Ядро SC140 послужило основой DSP-процессора MSC8101, созданного Motorola для реализации систем третьего поколения, Internet-устройств и многоканальных цифровых абонентских линий. Помимо DSP-ядра, MSC8101 имеет память 512 Кбайт, 32-разрядный RISC-процессор, 64-разрядную шину Power PC, гибкое устройство системной интеграции и 16-канальное устройство прямого доступа к памяти. В системе обеспечивается быстродействие процессорного ядра 1,2 млрд. операций в секунду, RISC-процессора — 3 млрд. операций в секунду.

Analog Devices

Специалисты компании разработали 16-разрядное процессорное ядро ADSP-219x для сотовых телефонов третьего поколения. Быстродействие интегральной схемы с четырьмя такими ядрами составляет 1,2 млрд. операций умножения с накоплением в секунду при потреблении 0,4 мА/млн. операций в секунду и напряжении питания 2,5 В. В схеме также используется высокопроизводительный шинный интерфейс АМВА компании ARM, который облегчает интеграцию со стандартными устройствами памяти, последовательными портами, каналами связи. Одно из последних предложений компании — схемы AD6489/AD6689, дополненные соответствующим ПО и предназначенные для широкополосной передачи цифровых и голосовых данных.

В кооперации с Intel разработан 16-разрядный процессор Blackfin, в котором применена архитектура Micro Signal Architecture. Это первый процессор с динамическим управлением питания, которое заключается в независимой регулировке как напряжения, так и частоты, что приводит к снижению потребления энергии на 60%. Подобные устройства предназначены для реализации видеоприложений в Internet. Ведется работа по увеличению тактовой частоты процессора до 1 ГГц и выше.


Наступает эра DSP

Впечатляющий прогресс физики полупроводников проявляется во все более широком распространении сотовых телефонов и голосовой почты, в удаленном доступе, в расширяющемся применении портативных компьютеров и PDA, видеоплейеров, видеокамер и систем, связанных с использованием Internet. В основе функционирования многих этих устройств лежат сигнальные процессоры