Январский номер традиционно посвящен обзору перспективных направлений развития ИТ, среди которых на этот раз Интернет вещей, Большие Данные и аналитика, машинное зрение, визуализация и дополненная реальность, облака, наука идентификации и биометрия, экологически чистые и энергосберегающие вычисления. Редактором выпуска был сотрудник Google Рой Вонт (Roy Want), который в соавторстве с коллегами из этой компании написал статью «Механизмы Интернета вещей» (Enabling the Internet of Things), где подробно рассмотрел перспективы исследований и разработки в соответствующей области.
Сотрудники исследовательского подразделения IBM Фади Гебара (Fadi Gebara), Питер Хофсти (Peter Hofstee) и Кевин Новка (Kevin Nowka) опубликовали статью «Второе поколение систем Больших Данных» (Second Generation of Big Data Systems) — обзор важных изменений в системах работы с Большими Данными в связи с появлением новых технологий и приложений.
Питер Фонаш (Peter Fonash ) и Филлис Шнек (Phyllis Schneck) из американского министерства внутренней безопасности в статье «Кибербезопасность: от месяцев до миллисекунд» (Cybersecurity: From Months to Milliseconds) рассуждают о новых видах угроз и требованиях к защите, появляющихся с приходом Интернета вещей.
Авторы публикации «Анализ данных жителей умного города с сохранением приватности» (Interoperable Privacy-Aware E-Participation within Smart Cities) Константинос Патсакис (Constantinos Patsakis), Пол Лерд (Paul Laird), Майкл Клир (Michael Clear), Мелани Бурочи (Melanie Bourochea) и Агусти Соланас (Agusti Solanas) предлагают алгоритмы обеспечения приватности в умных городах, полагающиеся на системы «краудсенсинга» (crowdsensing) — анализа информации, одновременно поступающей с датчиков мобильных устройств множества людей, с целью извлечения полезных знаний.
Медицина персонализируется
Тема февральского номера журнала Computer (IEEE Computer Society, V. 48, No. 2, 2015) — технический прогресс в медицине. Новые технологии сулят революцию в медицине, открывая, с одной стороны, колоссальные возможности с точки зрения персонализации диагностики и лечения, а с другой — создавая серьезные угрозы сохранности медицинских данных. Какие новшества ждут медицину в ближайшие пять-десять лет? Стремительный технический прогресс и накопление знаний о человеческом организме позволяют совершенно по-новому следить за здоровьем пациентов, в том числе предоставляя это им самим. На подходе — реальная персональная медицина, которая заменит универсальные стандарты лечения на методы, учитывающие уникальные характеристики каждого пациента.
Цзиньцюань Ли (Jinquan Li) в статье «Обеспечение приватности в системах личных медицинских карт» (Ensuring Privacy in a Personal Health Record System) напоминает о важном, но нередко упускаемом из виду различии между электронными медицинскими картами (Electronic Medical Records, EMR), которые обычно ведутся врачами, и личными медицинскими картами (Personal Health Records, PHR), которые сами люди могут хранить в электронном виде, чтобы управлять информацией о своем здоровье и делиться ею. Приватность данных EMR в Соединенных Штатах гарантируется законом, а информация из PHR, которая может размещаться в Сети и на личных устройствах, юридической защиты не имеет, поэтому пользователям лишь остается полагаться на добросовестность провайдеров соответствующих сервисов и всех, кто собирает, хранит и распространяет данные из PHR. Как полагает автор, передать контроль над данными от провайдеров к потребителям будет непросто. Последствия намеренного или случайного раскрытия данных PHR могут быть серьезными — базы информации о здоровье населения имеют большую ценность для третьих сторон: фармацевтических компаний, страховщиков, маркетологов, кадровых агентств, которые не всегда заботятся об интересах пациентов.
Растущая роль мобильных устройств в управлении здоровьем — тема статьи «Самостоятельный контроль над заболеваниями с помощью мобильных технологий» (Intelligent Disease Self-Management with Mobile Technology), которую написали Марина Великова (Marina Velikova), Питер Лукас (Peter Lucas) и Мартен ван дер Хейден (Maarten van der Heijden). Сегодня сознание людей может быть практически круглосуточно занято Интернетом, а вскоре и наши организмы начнут непрерывно передавать физиологические показатели программным системам для анализа и выдачи прогнозов. Новые возможности для самостоятельного контроля заболеваний откроются в том числе благодаря применению встроенных средств смартфона в медицинских целях: например, с помощью микрофона можно оценивать работу легких, а с помощью камеры — определять насыщенность крови кислородом. Надвигающаяся волна всевозможных носимых устройств ускорит прогресс, но и усугубит опасности — новое оборудование и мобильные приложения, предназначенные для повышения эффективности персональной медицины, неизбежно станут и источниками новых проблем, например повышения качества обслуживания. Способны ли мобильные устройства обеспечить его на адекватном уровне в различных сценариях — скажем, при мониторинге сердечного ритма пациента в послеоперационном отделении; мониторинге и анализе физиологических показателей пациента в реанимации; эпизодической отправке данных домашними пациентами или клиниками, находящимися в отдаленных районах; контроле потоков данных медицинским персоналом с помощью мобильных устройств; работе больничных станций мониторинга, чья задача состоит в пристальном контроле над общей работоспособностью систем.
В статье «Качество обслуживания в мобильной медицине реального времени» (Medical-Grade Quality of Service for Real-Time Mobile Healthcare) Кюн Тхэ Кан (Kyungtae Kang), Цисинь Ван (Qixin Wang), Чун Бем Хур (Junbeom Hur), Кюн Чон Парк (Kyung-Joon Park) и Луи Ша (Lui Sha) исследуют проблемы обеспечения производительности, надежности, приватности и безопасности, требуемых для обеспечения оперативности, конфиденциальности и безошибочности локальной и удаленной работы медицинских приложений.
Чтобы извлекать пользу из колоссальных объемов медицинских данных, нужно решить задачи хранения, обмена и защиты. Какие возможности откроются благодаря этому? Аршдип Бага (Arshdeep Bahga) и Виджай Мадисетти (Vijay Madisetti) в статье «Интеграция и обработка медицинских данных в облаке» (Healthcare Data Integration and Informatics in the Cloud) описывают программную архитектуру для координации сбора медицинских данных в различных форматах, управления ими и защищенного обмена между различными сторонами. Созданные на базе такой системы мобильные и веб-приложения реализуют функции эпидемиологического контроля, предсказания побочного действия лекарств и выдачи прогнозов лечения.
Еще более широкие возможности в области персональной медицины обещает всеобщая доступность услуги полного секвенирования генома человека, которая, естественно, сопровождается и новым пластом проблем. Эрман Эйдей (Erman Ayday), Эмилиано де Кристофаро (Emiliano de Cristofaro), Жан-Пьер Хубо (Jean-Pierre Hubaux) и Джин Цудик (Gene Tsudik) в статье «Полное секвенирование генома: революция в медицине или катастрофа для приватности» (Whole Genome Sequencing: Revolutionary Medicine or Privacy Nightmare) предсказывают наступление новой эры «прогнозной, профилактической, кооперативной персонализированной медицины». Но, как у большинства новых технологий, здесь имеется и оборотная сторона: геномная биометрия создает массу возможностей для компрометации персональных данных.
Перспективы применения Больших Данных
Тема мартовского номера журнала Computer (IEEE Computer Society, Vol. 48, No. 3, 2015) — применение новых возможностей, возникающих благодаря развитию систем работы с Большими Данными, которые фундаментально меняют методологию научных исследований, принципы разработки продуктов и предоставления услуг, но, с другой стороны, порождают новые трудности.
В статье «Работающие в памяти графовые базы данных для WWW» (In-Memory Graph Databases for Web-Scale Data) Вито Джованни Кастеллана (Vito Giovanni Castellana), Алессандро Морари (Alessandro Morari), Джесси Уивер (Jesse Weaver), Антонино Тумео (Antonino Tumeo), Давид Хаглин (David Haglin), Оресте Вилла (Oreste Villa) и Джон Фео (John Feo) описывают построенный на графовых методах стек ПО для развертывания основанных на модели Resource Description Framework баз данных поверх высокопроизводительных кластеров стандартной архитектуры с распределенной памятью. Сегодня в некоторых предметных областях стали предпочтительны базы на основе RDF, применяемые для управления очень большими объемами гетерогенных квазиструктурированных данных.
Авторы статьи «Ускорение тиражирования событий Больших Данных с помощью планирования мощности» (Taming Replication Latency of Big Data Events with Capacity Planning) Чжэньюнь Чжуан (Zhenyun Zhuang), Харичаран Рамачандра (Haricharan Ramachandra) и Чаоюе Сюн (Chaoyue Xiong) предлагают решение задачи сокращения задержки при тиражировании событий баз данных. Основываясь на наблюдениях за рабочим трафиком и различными компонентами сети LinkedIn, они разработали модель прогнозирования уровней входящего трафика, уменьшения задержки тиражирования и планирования мощности.
В статье «Интеграция Больших Данных с помощью семантической системы ETL» (Integrating Big Data: A Semantic Extract-Transform-Load Framework) Шривидия Бансал (Srividiya Bansal) и Себастиан Кагеманн (Sebastian Kagemann) описывают систему извлечения, преобразования и загрузки данных, интегрирующую информацию из множества источников. Авторы приводят примеры конкретных систем: в первой осуществляется интеграция сведений о транспортных потоках и маршрутах в США с данными о расходе топлива автомобилей различных производителей, а во второй происходит объединение срезов данных нескольких крупных операторов массовых открытых обучающих онлайн-курсов (Massive Open Online Course, MOOC).
В статье «Управление данными в медицинских информационных системах: много моделей, одно решение» (Managing Data in Healthcare Information Systems: Many Models, One Solution) Карамджит Каур (Karamjit Kaur) и Ринкл Рани (Rinkle Rani) описывают архитектуру медицинской информационной системы, одновременно полагающейся на реляционную, документную и графовую базы данных.
Заключительная тематическая статья номера «Optique: Большие Данные крупным планом» (Optique: Zooming in on Big Data), которую написали Мартин Гизе (Martin Giese), Ахмет Сойлу (Ahmet Soylu), Гильермо Вега-Горгохо (Guillermo Vega-Gorgojo), Арилд Ваалер (Arild Waaler), Петер Хаазе (Peter Haase), Эрнесто Хименес-Руис (Ernesto Jimenez-Ruiz), Давид Ланти (Davide Lanti), Мартин Реск (Martin Rezk), Гохой Сяо (Guohui Xiao), Озгюр Озчеп (Ozgur Ozcep) и Риккардо Росати (Riccardo Rosati), посвящена платформе, унифицирующей доступ к разнородным источникам данных и позволяющей составлять запросы с помощью интуитивно понятного графического интерфейса.
Александр Тыренко (shoorah@osp.ru) — обозреватель «Computerworld Россия» (Москва).