За последние полвека в индустрии ИТ маятник моды на архитектуру обработки и хранения данных несколько раз качался от централизации к децентрализации и обратно. Вначале вычисления выполнялись на механических и аналоговых устройствах, затем — на мейнфреймах, после этого — на персональных компьютерах, далее — в клиент-серверных архитектурах и облаках. И вот теперь ожидается новый переход — к распределенным вычислениям средствами периферийных устройств, составляющих современный Интернет вещей.
О возможности создания управляемых взаимодействующих экосистем заговорили еще в 1994 году, когда появились встраиваемые микропроцессоры [1]. Сегодня ядром такой экосистемы считается облако — группа фиксированных центров обработки данных, соединенных между собой и содержащих вычислительную инфраструктуру, приложения и данные. Периферию в этой модели составляют устройства с датчиками, процессорами, хранилищами и сетевым соединением с облаком. Иерархическую систему взаимосвязей между периферией и облаком, включающую локальные системы обработки, шлюзы, сетевые устройства и средства обеспечения безопасности, принято сегодня называть «туманом» (fog).
Говорить о взрывном росте Интернета вещей было бы преуменьшением. По разным оценкам, сегодня на каждого жителя Земли приходится уже по пять устройств Интернета вещей и их количество будет увеличиваться на 12% ежегодно, достигнув к 2030 году 125 млрд [2]. Еще быстрее растет оборот рынка Интернета вещей в денежном выражении: в 2019 году он составил 1,7 трлн долл., что на 350% больше по сравнению с показателями 2013 года [3]. Растущая вселенная соединенных устройств генерирует астрономические объемы информации, способствуя смещению центра тяжести данных от облака к периферии. По прогнозу аналитиков IDC, уже к 2025 году устройства Интернета вещей будут генерировать больше данных, чем все ЦОДы, — на долю первых придется 90 из 175 зеттабайт, которые к тому времени составят глобальную инфосферу.
Сложности
С ростом объемов наборов данных обмениваться ими становится все труднее, поэтому приложения и сервисы стараются перемещать ближе к источникам информации для уменьшения задержки на передачу и для повышения скорости обмена. Однако смещение центра тяжести данных от облака к периферии и рост их объема на устройствах-источниках ведут к ряду проблем.
Пропускная способность. На периферии скоро будет создаваться столько данных, что производительности сетей для их передачи в облако станет недостаточно. Например, каждый беспилотный автомобиль будет генерировать от 5 до 20 Тбайт в день, и возможностей даже еще не развернутых 10-мегабитных сетей 5G в скором времени перестанет хватать.
Задержка. Многим современным распределенным приложениям Интернета вещей требуется обрабатывать данные в облаке. По мере смещения центра тяжести данных к периферии, задержка передачи информации между облачными приложениями и устройствами будет расти, что приведет к серьезным проблемам для систем, требующих моментального отклика, в том числе применяемых на производстве, в медицине, безопасности и электроэнергетике.
Отказы. Работа периферии зависит от наличия связи. Перебои в работе сервиса, сервера или сети негативно скажутся на функционировании периферийных систем, использующих внешние ресурсы для обработки и хранения данных, обеспечения безопасности и управления. А локальный отказ может распространиться на соседние устройства, что вызовет каскадное отключение сегмента периферийной системы целиком.
Безопасность. С переходом данных на периферию поверхность атаки отдельно взятого предприятия увеличивается экспоненциально. Каждое граничное устройство, каждое соединение Интернета вещей, распределенное приложение и каждый пользователь периферийной системы становятся потенциальными мишенями злоумышленников.
Приватность. Большая часть данных и метаданных, созданных периферийными устройствами, содержит персональную информацию и другие закрытые сведения. С переносом данных на периферию вопросы собственности, прав и конфиденциальности усложняются.
Для уменьшения влияния перечисленных проблем, на периферию и в «туман» (инфраструктуру межсоединений) переносят вычислительные ресурсы. Ближе к периферии размещают небольшие центры обработки данных, которые предоставляют ресурсоемким, выполняющим много транзакций периферийным приложениям мощные вычислительные ресурсы и обеспечивают меньшую задержку. Такие ЦОДы называют «клаудлетами» (cloudlet — «облачко»), а соответствующую концепцию — «туманными вычислениями» (fog computing). С перемещением вычислений на периферию, проблемы пропускной способности, сетевой задержки и перебоев ослабляются, но не исчезают полностью.
С ростом вычислительной мощности, доступной вне облака, на периферию мигрируют и сложные аналитические приложения со встроенными моделями искусственного интеллекта. Аналитика выполняется на периферии, соответственно, и решения ИИ формируются ближе к передающим телеметрию датчикам и исполнительным устройствам, реагирующим на результаты аналитической обработки. Кроме того, применение стандартов параллельного программирования, таких как OpenAAC и MPI с поддержкой CUDA, позволяет уменьшить сетевую задержку и обеспечить периферийным приложениям автономию на случай обрыва соединения с облаком.
Все эти факторы привели к появлению концепции «умной периферии» (Smart Edge).
Умная периферия
Умная периферия охватывает показания периферийных устройств, данные вычислений и аналитики, а также инструменты искусственного интеллекта. Соответствующие решения стали применять уже в целом ряде отраслей.
Здравоохранение. Здесь активно внедряется умная периферийная медицинская техника: наручные, внутриушные, инъецируемые, проглатываемые устройства с функциями машинного зрения, контроля состояния организма и дистанционного мониторинга. Эволюция медицинских устройств и развитие туманных вычислений ведут к появлению «умных больниц»: данные передаются от медицинских устройств аналитическим платформам для формирования выводов, доступных локальным и удаленным пользователям и системам.
Сельское хозяйство. С развитием процессоров и появлением всевозможных датчиков развивается сектор «умного сельского хозяйства», субъекты которого автоматизируют процессы посева, выдачи кормов, удаления сорняков, сбора урожая и т. д., используя для этого датчики, видеокамеры, дроны, роботизированные машины и системы обработки телеметрии. Умная периферия обеспечивает непрерывный мониторинг состояния почвы, сельскохозяйственных культур, окружающей среды, предоставляя точную актуальную информацию и аналитические сведения. Благодаря новым технологиям стало возможным создание многоярусных вертикальных ферм, в которых датчики и системы аналитики помогают создавать оптимальные условия для выращивания сельскохозяйственной продукции на относительно малых площадях.
Транспортировка. Говоря о технологиях умной периферии, нельзя не упомянуть как беспилотные автомобили, так и связанные с ними проблемы передачи данных и риски безопасности. Умная периферия способствует развитию не только робомобилей потребительского класса, но и решений для роботизированной доставки грузов автомобильным, железнодорожным, водным, воздушным транспортом, а следовательно — интеллектуальных портов, дорог и систем управления движением. Наилучшим образом преимущества концепции умной периферии обещают раскрыться благодаря технологиям V2X (vehicle-to-everything), которые позволят транспортным средствам и системам управления дорожным движением взаимодействовать напрямую (без участия облака), используя, например, связь 5G и IEEE 802.11p/Dedicated Short-Range Communications. Такая технология способна обеспечить эффективные безопасные перевозки всеми видами транспорта.
Туманные вычисления и микроЦОДы. По мере развития технологий умной периферии, их начнут применять во всех отраслях, что повысит зависимость от организационной иерархии выполнения туманных вычислений — сбора и распределения данных, передачи сведений о политиках, учетных записях и безопасности по всей периферийной экосистеме. При этом для обработки данных вблизи источников активно используются средства искусственного интеллекта. Ресурсы туманных вычислений размещаются в иерархически соединенных микроЦОДах, представляющих собой контейнеры, содержащие устойчивую, мощную и не требующую обслуживания вычислительную конфигурацию. Такие ЦОДы постепенно начинают появляться в разных организациях: банках, производственных предприятиях, розничных магазинах, «умных» зданиях, компаниях телекоммуникационной и электроэнергетической отраслей.
Развитие умной периферии чревато рядом неочевидных последствий и возникновением вопросов, требующих изучения. Например, что происходит, когда потребности в аналитической обработке начинают превышать возможности граничного устройства? Как поступить, если объем данных на периферии становится настолько большим, что уже нет возможности загрузить его в «туманные» ЦОДы и облако? Как на уровне внутрипериферийной связи решить те же проблемы, что возникают при связи между периферией и облаком: перебои, нехватка пропускной способности, чрезмерная задержка, бреши безопасности? Как защитить весь гигантский трафик периферии от перехвата с учетом того, что шифрование дополнительно увеличивает его объем? Как обеспечить прозрачность принимаемых на периферии решений при расследованиях локальных и каскадных отказов, если в интеллектуальных приложениях, как правило, используются когнитивные модели, работающие по принципу «черного ящика»?
Периферия на первом плане
Несмотря на сложности и неопределенность, инвесторы увидели в периферии огромный потенциал и активно поддерживают стартапы соответствующего профиля, наперебой предлагающие инновационные решения, использующие возможности периферии.
Стратифицированное (расслоенное) обучение (stratified learning). В существующих монолитных конвейерах модели ИИ обучаются в облаке, после чего их передают на уровни «тумана» и периферии. С периферии в облако поступают данные обратной связи, на которых модель дополнительно обучается и снова пересылается на периферию. В умной периферии этот цикл дополняется быстрым локальным обучением вблизи источников данных и сетей взаимодействия датчиков и исполнительных систем. Локально обученные модели отправляют в облако, где их объединяют с главной моделью. Сейчас подобные схемы реализуются в экспериментальном порядке, но возможность выполнения локального обучения в режиме реального времени на больших потоках данных, особенно видеоинформации высокого разрешения, обещает широкие перспективы в сфере обеспечения безопасности.
Интеллектуальные дайджесты данных. Устройства умной периферии, будь то смартфон, производственный датчик, промышленный робот или система дистанционной хирургии, создают огромные объемы данных, лишь малая доля которых содержит полезную информацию. В соответствии с современными нормами, принято сохранять весь объем генерируемых данных, так как неизвестно, какие из них могут понадобиться завтра, что, может быть, и логично, но неэффективно. Инновационные решения для формирования интеллектуальных дайджестов данных и уменьшения их объема обещают возможность в автоматическом режиме находить значимые «иголки» в бессмысленных «стогах сена». Возможно, это похоже на попытки угадать выигрышные номера лотереи, но исследования в области методов редукции атрибутов (attribute reduction), цифровых потоков (digital threading) и анализа главных компонентов дают основания надеяться на появление технологий, которые позволят эффективно сокращать объем данных на периферии.
Аналитический суверенитет личности. Законы о суверенитете данных, например европейский GDPR, определяют юрисдикцию, в которой оказывается тот или иной набор данных. Законы вроде калифорнийского Акта о защите конфиденциальности потребителей CCPA вводят понятие суверенитета личных данных, наделяя индивидуума правом контроля за сбором, распространением и удалением своей персональной информации. По аналогии, аналитический суверенитет личности предоставляет ей право контролировать модели искусственного интеллекта, обученные на персональных данных. Ведь даже если у пользователя есть право суверенитета личных данных, находящихся на устройстве умной периферии, заинтересованные стороны смогут обойти соответствующий закон, воспользовавшись уже готовыми моделями искусственного интеллекта. При наличии закона об аналитическом суверенитете личности было бы легко получить ответ, скажем, на такой вопрос: кому принадлежит модель совершения розничных покупок конкретным покупателем — ему самому, продавцам или системе электронной коммерции, изучающей покупательские привычки? Решения, способные давать однозначный ответ на подобные вопросы, могли бы предоставлять пользователю портативную, защищенную, контролируемую им поведенческую модель, которая использует и передает персональные данные, необходимые для совершения транзакций, но при этом обеспечивает контроль цифровой «персоны» владельца.
***
Бурное развитие Интернета вещей сопровождается непрерывным ростом данных на периферии и ведет к значительному усложнению всей экосистемы, что вызвало появление «умной периферии» — размещение вычислительных мощностей и систем аналитики с искусственным интеллектом ближе к источникам данных. Устройства умной периферии и туманные вычисления активно внедряются во всех отраслях, что заставляет искать решения многочисленных проблем, связанных с пропускной способностью, сетевой задержкой, безопасностью, приватностью и пр. Для преодоления таких проблем разрабатываются инновационные решения, использующие возможности умной периферии: системы стратифицированного обучения (когнитивная обработка и обучение в реальном времени) и интеллектуальные дайджесты данных (автоматическое повышение ценности данных при ограничении роста их объемов на периферии). Но, возможно, самая важная перспектива умной периферии — появление сверхадаптивных персонализируемых приложений и сервисов, защищенных средствами соблюдения аналитического суверенитета личности.
Литература
1. R. S. Raji. Smart networks for control // IEEE Spectrum. — 1994. — Vol. 31, N. 6. — P. 49–55.
2. J. Howell. Number of connected IoT devices will surge to 125 billion by 2030, IHS Markit says. IHS Markit Technology, Oct. 24, 2017. [Online]. URL: https://technology.ihs.com/596542/number-of-connected-iot-devices-will-surge-to-125-billion-by-2030-ihs-markit-says (дата обращения: 08.03.2020).
3. CB Insights. What is edge computing? CB Insights Research, New York, Aug. 8, 2018. URL: www.cbinsights.com/research/what-is-edge-computing (дата обращения: 08.03.2020).
Марк Кэмпбелл ( MCampbell@trace3.com ) — директор по инновации, компания Trace3.
Mark Campbell, Smart Edge: The Effects of Shifting the Center of Data Gravity Out of the Cloud. IEEE Computer, December 2019, IEEE Computer Society. All rights reserved. Reprinted with permission.