Еще в 1967 году философ Маршалл Маклюэн отметил, что «электрические информационные устройства, предназначенные для повсеместной деспотичной слежки за человеком от колыбели до могилы, создают крайне серьезную дилемму между стремлением человека сохранить личную тайну и потребностью общества в знании» [1]. Это поистине пророческая мысль, если учесть, что в то время музыку записывали на виниловые пластинки, данные — на бобины с магнитной лентой, системы хранения данных только зарождались, а о ПК, мобильных устройствах и Интернете еще и не мечтали. Сообщив всему миру о деятельности АНБ, Эдвард Сноуден фактически продемонстрировал, что «серьезная дилемма» Маклюэна стала реальностью — неприкосновенность частной жизни граждан сегодня под большим вопросом. Но откровения Сноудена не были сюрпризом — пресса и раньше сообщала о том, что АНБ может вмешиваться в личные коммуникации людей [2]. На самом деле не только АНБ использует Интернет для добычи данных о гражданах — пользуясь несовершенством законодательства, частный сектор создает еще большую потенциальную угрозу приватности, чем правительства. Компании наподобие Amazon, Facebook и Google, не спрашивая разрешения, регулярно профилируют пользователей для вывода адресной рекламы [3], а, например, в ходе избирательной кампании Барака Обамы 2012 года медиааналитики пользовались легально доступными Большими Данными из социальных сетей, составляя списки еще не определившихся избирателей, выясняя, какие телепередачи они смотрят в непиковые периоды для размещения в это время рекламы своего кандидата. Таким образом удалось получить определенное количество голосов, сильно сэкономив по сравнению с конкурирующими избирательными кампаниями, которые «бомбардировали» зрителей своей рекламой именно в прайм-тайм.

Важность Больших Данных

Сноуден пролил свет на существование нового социального и технологического порядка, при котором особое значение имеют именно Большие Данные. Нет ничего удивительного в том, что АНБ глубоко проникло в Кремниевую долину — в развитие новых технологий агентство инвестирует около 8 млрд долл. ежегодно, а это важно, поскольку считается, что стартапы часто превращаются в гигантов Кремниевой долины. Сноуден же впервые подтвердил существование крупного федерального инвестора, имеющего огромное влияние на технологические компании. Распределение инвестиций АНБ по большей части держится в секрете, что, казалось бы, противоречит «открытой» культуре предпринимательства в индустрии ИТ. По всей видимости, аппарат федеральной безопасности активно инвестирует в технологии добычи и анализа информации — вот каковы истинные ставки в игре под названием «Большие Данные».

В сущности, гигантский ЦОД АНБ в штате Юта много больше, чем у Google, Facebook или Amazon. Объем данных во всем мире сегодня исчисляется зеттабайтами (1021 байт) и растет практически по закону Мура. Задача обработки этих гигантских массивов для извлечения информации, представляющей ценность для разведки, невероятно сложна: многочисленность взаимосвязей, которые выявляются по метаданным или иными способами, требует новых аналитических подходов на основе алгоритмов, до недавнего времени бывших лишь предметом абстрактных математических теорий.

Что все это означает с точки зрения проблем приватности? Возможно, стоит совершить небольшой экскурс в историю.

Появление сложных сетей

Программное обеспечение — это самая революционная технология последнего столетия. Благодаря ПО начался и еще продолжается радикальный переход от индустриальной эры с ее механистичной рационализацией к информационной, характеризующейся «системным мышлением». В индустриальную эру основное внимание уделялось эффективности и воспроизводству идентичных предметов, а информационная эпоха требует специализированных решений и средств сверхбыстрого масштабирования. Глобальное предпринимательское движение, имеющее один из своих центров в Кремниевой долине, процветает именно за счет способности быстро адаптироваться.

Когда обширная система — самоорганизующаяся и адаптивная, фокусироваться на мелких деталях уже недостаточно: сосредоточенность на деталях может подвести к коренным переменам, но лишь в контексте всей системы. Если внимание уделяется только деталям, а не картине в целом, сложно предсказывать возможные результаты. Из этого не следует, что классическая физика, электронное, тяжелое и авиационное машиностроение «мертвы»: на пороге эры полностью автономных систем дисциплины из этих отраслей необходимы сами по себе, но неспособны объяснять поведение систем в целом. Сегодня для совершения открытий и создания новшеств требуется коллективное, мультидисциплинарное мышление.

Неожиданным следствием наступления Информационной эры стала сложность анализа взаимосвязей и взаимодействий, присутствующих независимо от того, в каком контексте рассматриваются повсеместные сети — с точки зрения агентного моделирования, теории поведения роя, эволюционного приспособления, теории хаоса, самоорганизации или обусловленных неоднородностью изменений. Само собой разумеется, что сети становятся объектом изучения отдельной научной дисциплины — недавно Северо-Западный университет первым в США начал готовить специалистов в этой области.

Хотя сети существовали всегда, многие из них не замечали и не исследовали, пока не созрела наука об информации. Сегодня сети можно видеть во всем — от глобальной экономики до Интернета, от экологии водоемов до взаимодействий белков, от Facebook до квантовой физики. Сети, какова бы ни была их форма, состоят из вершин и соединяющих их ребер, а природа этих взаимосвязей, их источники и взаимодействия способны давать ценную информацию. Сети можно дискретно измерять, обходить и описывать с помощью теории графов. Именно благодаря этому математическому инструменту и стало возможным стремительное развитие анализа Больших Данных.

Сети внутри сетей

Сетевые архитектуры — а значит, их проектирование, тестирование и оценка — будут все активнее полагаться на методы из теории графов, особенно в случаях, когда взаимосвязи в сети динамически меняются со временем. Глубоко вложенные программные сети трудно понять с традиционной редукционистской, статичной точки зрения, что можно видеть на примере современных систем вооружений, в которых любые проблемы с надежностью ПО непомерно раздувают бюджеты и сбивают графики проектов.

С появлением все более автономных систем вложенность сетей растет. Взять к примеру полностью автономный беспилотный летательный аппарат — «дрон», управляемый собственными глубоко вложенными программными сетями и взаимодействующий с другими устройствами в контролируемом воздушном пространстве. Военные беспилотники управляются сетью командования и контроля, в которой присутствуют свои вычислительные системы. Таким образом, интеграция современных систем неизбежно требует изучения сетей, глубоко вложенных в другие сети, — такой анализ необходим, чтобы выявить все контекстные роли в рамках более крупной общности.

Автономных робототехнических систем специального назначения, в том числе киберфизических и кибербиологических, будет все больше — уже сегодня «вещей» в широком смысле в Интернете стало больше, чем людей. С ростом этого соотношения масштаб и охват кибербиологических и киберфизических систем будет увеличиваться. Теоретические знания об этих сложных взаимозависимых автономных сетевых системах и контроль над ними станут критически важными — иначе такие системы сами начнут контролировать людей. Эта теоретическая возможность — еще один фактор, объясняющий необходимость контроля над Большими Данными.

Будущее

С инженерной точки зрения последствия, к которым может привести отказ от использования Больших Данных, станут чудовищнее любого апокалиптического сценария из научной фантастики, живописующего потерю контроля людей над машинами. Распространение систем автоматизированного создания ПО неизбежно, как и совершенствование датчиков, улучшающих собственную способность автоматических систем к восприятию чего бы то ни  было.  Уже сегодня существуют цепи обратной связи, не контролируемые человеком. Каждое такое «достижение» становится новым шагом к подчинению человека воле машины, создавая очередные проблемы этики и контроля, куда более серьезные, чем нынешние дебаты о дилемме между требованиями защиты национальной безопасности и неприкосновенности частной жизни. С другой стороны, ощутимые перемены, ставшие следствием технических достижений, делают отказ от использования Больших Данных на благо общества упражнением в отрицании прогресса, гарантирующего утрату приватности, индивидуальности и жизненных ориентиров. И напротив, целенаправленное использование аналитических технологий способно подхлестнуть дискуссию, которая позволит выяснить, как далеко может зайти прогресс в развитии этих технологий, прежде чем они станут угрозой.

В конечном счете важны не вопросы законности или незаконности и даже не проблема терпимости общества к тотальной слежке — более весомы вопросы о том, что именно технологии могут предложить и до какой степени они будут служить нам, а мы — им. Эти вопросы предстоит решать на глобальном, а не на местном уровне — все люди Земли сегодня «в сети», хотят они того или нет.

Что делать?

Что можно предпринять в условиях нового общественного и технологического порядка, создающего все большую угрозу приватности и личной безопасности? Очевидное решение — повышение степени информированности населения, но этого слишком мало, поэтому необходимо еще глубокое понимание обществом новейших сетевых технологий. Границы между «добром» и «злом» сетевых сред — рыночных, социальных, относящихся к безопасности и т. д. — тонки, как лезвия, и уже нет времени на разработку целенаправленных образовательных программ всех уровней. Нужна научно-образовательная реформа, в рамках которой изолированное преподавание различных предметов, свойственное индустриальной эре, уступит место мультидисциплинарным, коллегиальным подходам к решению задач. Нужно избавиться от ситуации, когда Большие Данные остаются лишь уделом дорогостоящих специалистов по численному анализу. Для выживания человека и его дальнейшей эволюции нужно поощрять междисциплинарное образование, базирующееся на фундаменте количественных методов. К сожалению, нынешняя слабость вузовского образования в сфере прикладной математики, например, в США свидетельствует о неспособности этой нации в полной мере оценить масштаб происходящих технологических перемен.

Однако не стоит впадать в фатализм, логически обосновывая свою неспособность в полной мере оценить происходящее и тем самым добровольно отказываясь от приватности. Если воображать худшие сценарии, не пытаясь в то же время искать способы их предотвращения, эти сценарии становятся более вероятными. Если отвлечься от фантастики, неосведомленность о стремительно развивающихся технологиях и принципах их действия играет на руку нарушителям тайны личной жизни, и единственное оружие против них — знания. Только полная осведомленность поможет провести четкую границу между информацией (или Большими Данными), необходимой для служения интересам общества, и сведениями, которые должны остаться персональными.

***

Полвека тому назад Маршалл Маклюэн оказался абсолютно прав — только образованное общество способно аргументированно отстаивать свою позицию и принимать необходимые меры в ее поддержку.

Литература

  1. M. McLuhan, Q. Fiore. The Medium is the Massage: An Inventory of Effects. Random House, 1967.
  2. D. Burnham. The Silent Power of the NSA. New York Times Magazine, 27 Mar. 1983. URL: http:// www.nytimes.com/1983/03/27/magazine/the-silent-power-of-the-nsa.html (дата обращения 22.05.2014).
  3. J. Leber. Amazon Woos Advertisers with What It Knows about Consumers. MIT Technology Rev., 21 Jan. 2013. URL: http://www.technologyreview.com/news/509471/amazon-woos-advertisers-with-what-it-knows-about-consumers (дата обращения 22.05.2014).

Джордж Херлберт (ghurlburt@change-index.com) — руководитель исследований компании Stemcorp, Джеффри Воас (jeffrey.m.voas@gmail.com) — почетный сотрудник IEEE.

George F. Hurlburt, Jeffrey Voas, Big Data, Networked Worlds, IEEE Computer, April 2014, IEEE Computer Society. All rights reserved. Reprinted with permission.