Настоящее и будущее визуализации

Настоящее и будущее визуализации Тематическая подборка номера содержит шесть регулярных статей, предваряемых заметкой «Передовые исследования в области визуализации» (Cutting-Edge Research in Visualization). Сегодня в области визуализации исследуются методы преобразования данных к представлениям, используемым при разработке процессов познания, обеспечивающих лучшее понимание смысла данных. Одно из самых распространенных визуальных представлений — линейная диаграмма — используется уже более тысячи лет, а предложенные около трех столетий тому назад такие инструменты, как столбчатая диаграмма, круговая диаграмма, диаграмма рассеяния и гистограмма, привели к появлению статистической графики — набора методов, применяемых для анализа данных. В 1990-е годы сформировалось направление визуализации информации (information visualization), в котором основное внимание уделялось разновидностям непространственных данных, распространенным в гуманитарных, общественных, экономических и многих других дисциплинах. Десятью годами позже возникло направление визуальной аналитики (visual analytics), обеспечивающее тесную связь визуализации с другими дисциплинами: добычей данных (data mining), машинным обучением (machine learning) и т. д.

Сегодня визуализация означает намного большее, чем набор методов машинной графики и построения трехмерных сцен, — имеется множество методов визуализации для любых видов данных, включая: тексты, документы и языковые корпусы; деревья, графы и сети; коллекции изображений и видео; временные ряды, табличные и многомерные данные; географические данные; скаляры, векторы и тензорные поля и др. Визуализация часто воспринимается как средство воздействия на публику за счет обеспечения качественных изображений и анимации, однако многочисленные исследования и опросы показывают, что визуализация позволяет повысить эффективность исследователей при систематизации и анализе данных. Визуализация облегчает формулировку новых гипотез, помогает при принятии решений, поддерживает эффективный обмен идеями и облегчает распространение знаний.

Первую регулярную статью тематической подборки написали Адити Маджамдер (Aditi Majumder) и Бехзад Саджади (Behzad Sajadi). Она называется «Широкоформатные дисплеи: изменение облика визуализации» (Large Area Displays: The Changing Face of Visualization). Обычно под термином «визуализация» понимается циклический процесс, в ходе которого операции с визуализированными данными приводят к их дальнейшей обработке и анализу, поэтому качество используемых дисплеев, в особенности широкоформатных, чрезвычайно важно для успешного применения практических приложений визуализации. В этом смысле визуализация является основой внешнего представления данных, облегчает общение при анализе и операциях с ними, а дисплей определяет доступный пользователям облик данных.

По мнению авторов статьи, достижения в области методов обработки данных во многом обеспечены развитием технологии широкоформатных дисплеев, что также открывает захватывающие перспективы в будущем. В статье приводится обзор работ в области широкоформатных дисплеев с начала 1990-х до настоящего времени (см. рисунок).

Ранние широкоформатные дисплеи: a — CAVE из Иллинойского университета в Чикаго; b — смонтированная в Принстонском университете 18-мегапиксельная стена на основе массива из 24 проекторов; c — 7-мегапиксельная стена из Калифорнийского университета в Ирвине на основе девяти проекторов; d — этот дисплей дает полностью гладкое изображение, как если бы оно создавалось дисплеем с одним проектором

Статью «Исследовательские проблемы программного обеспечения визуализации» (Research Challenges for Visualization Software) представили Хенк Чайлдс (Hank Childs), Берк Джевеси (Berk Geveci), Вилл Шредер (Will Schroeder), Джереми Мередит (Jeremy Meredith), Кристофер Севелл (Christopher Sewell), Торстен Кюхлен (Torsten Kuhlen) и Е. Вес Бетел (E. Wes Bethel). Программные приложения и библиотеки делают механизмы визуализации доступными пользователям, но, хотя пользователи знают, как следует интерпретировать результаты, обычно им не под силу самим визуализировать свои данные. Программное обеспечение позволяет скрыть от пользователей детали методов и их сложность, обеспечивая набор стандартных алгоритмов визуализации. Одной из основных причин потребности развития ПО визуализации является необходимость работы с Большими Данными, которые требуют методов, позволяющих работать не только с пространственно-временными формами данных, обычно используемыми в научной визуализации. Системы визуализации должны также научиться справляться с неструктурированными формами данных: текстами, графами, деревьями, таблицами и т. д.

Другой важной тенденцией является возрастающее разнообразие параллельных вычислительных систем, устройств визуализации и взаимодействия, пользовательских платформ, таких как планшеты. Это разнообразие затрудняет возможность программного обеспечения эффективно представлять, обрабатывать данные и поддерживать работу с ними.

При создании программного обеспечения визуализации разработчикам приходится вести исследования в области массивного параллелизма, разработки моделей архитектур процессоров и программирования, архитектур приложений и средств управления данными, модели данных и т.д.

Авторами статьи «Повествование: следующий шаг взуализации» (Storytelling: The Next Step for Visualization) являются Роберт Козара (Robert Kosara) и Джок Макинлей (Jock Mackinlay). В большей части ранних исследовательских работ в области визуализации основное внимание уделялось новым методам, что порождало вопросы о том, какой из них следует использовать и для решения какой задачи; это привело к появлению статей, в которых сравнивались методы и делались попытки установить механизмы восприятия, обосновывающие применение этих методов. Сегодня исследователи в состоянии найти подходящие пути для решения конкретных задач. Можно сказать, что имеющихся методов достаточно для того, чтобы работать с данными, однако все еще отсутствуют надежные знания о наилучших способах представления данных и обмена ими.

Людям всегда свойственно связывать факты в истории, это помогает лучше представить информацию и способствует ее запоминанию. По мнению авторов, использование элементов повествования является следующим шагом исследований в области визуализации, в особенности потому, что повествование позволяет эффективно представлять данные.

Статью «Переосмысление парадигмы взаимодействия в научной визуализации» (Reimagining the Scientific Visualization Interaction Paradigm) написали Дениэл Киф (Daniel Keefe) и Тобиас Айзенберг (Tobias Isenberg). Процессу совершения открытия всегда было свойственно использование новых способов изображения понятий и взаимодействия с ними — например, классические стробоскопические фотографии лошадей Мейбриджа привели к обнаружению того, что конь, бегущий галопом, во время бега отрывает все ноги от земли, а сделанные Леонардо да Винчи рисунки стремительно текущей воды способствовали зарождению гидродинамики. Сегодня инженеры, ученые и творческие работники постоянно используют физические модели и их трехмерные прототипы — изучение этих моделей часто позволяет по-новому понять суть явления. Было бы замечательно, если бы эти действия можно было производить в виртуальном пространстве визуализированных данных, где мощные компьютерные методы можно было бы комбинировать с естественными человеческими взаимодействиями и визуальными коммуникациями.

Чтобы это впечатляющее будущее стало реальностью, нужно научиться бесшовным образом встраивать инструменты графической визуализации в потоки работ ученых, инженеров и других пользователей. Достичь этой цели можно благодаря новым исследованиям естественных пользовательских интерфейсов для научной визуализации.

Бен Шнейдерман (Ben Shneiderman), Катерина Плейзант (Catherine Plaisant) и Бредфорд Хессе (Bradford Hesse) представили статью «Повышение качества здравоохранения на основе использования интерактивной визуализации» (Improving Healthcare with Interactive Visualization). Развитие медицинских информационных систем сулит революционные изменения в области здравоохранения во всем мире, однако для превращения этих перспектив в реальность потребуется огромный труд тысяч разработчиков, аналитиков, специалистов в области пользовательских интерфейсов и медицинских профессионалов. Хотя нужно решить много разных проблем, авторы данной статьи концентрируются на роли визуализации и процессов визуального анализа. Эти дисциплины обеспечивают алгоритмы, интерактивные архитектуры и аналитические процессы, поддерживающие исследования, мониторинг, профессиональное сотрудничество и понятные представления данных для пациентов, врачей, лиц, принимающих решения и общественности.

В 2011 году Институт медицины США опубликовал отчет, посвященный повышению уровня безопасности пациентов на основе «междисциплинарных исследований» и «применения ориентированного на пользователей подхода к построению архитектур медицинских информационных систем». В этом отчете говорится, что в области клинической медицины визуализация информации не настолько развита, как в других научных дисциплинах. В статье обсуждаются перспективы изменения этого состояния дел.

Последняя статья тематической подборки называется «Визуальный анализ данных из СМИ» (Visual Analysis of Social Media Data), а ее авторы — Тобиас Шрек (Tobias Schreck) и Даниэль Кейм (Daniel Keim). В социальных сетях пользователи генерируют контент в разных формах, и часто этот контент является свободно доступным. Эти данные можно использовать в разных целях: для совершенствования бизнес-процессов, для понимания тенденций формирования общественного мнения и т. д. Однако здесь возникает много проблем: данные социальных сетей очень объемны и передаются в интенсивных потоках, они разнородны, зачастую двусмысленны и в высшей степени зависят от контекста. Интеллектуальный анализ на основе методов машинного обучения дает возможность автоматически обнаруживать закономерности в данных, причем эти закономерности можно специфицировать алгоритмически. Интеллектуальный анализ позволяет сократить объем данных путем отбора наиболее интересных структур, а интерактивная визуализация моделирует деятельность аналитика и опирается на его фундаментальные знания.

Вне тематической подборки опубликованы две крупные статьи. Статью «IPv6: средство активации ботнетов и сетей распространения вредоносных программ и защиты от этих сетей» (IPv6: A Catalyst and Evasion Tool for Botnets and Malware Delivery Networks) написали Кинг Ли (Qing Li), Крис Ларсен (Chris Larsen) и Тим ван дер Хорст (Tim van der Horst). Взрывообразный рост числа доступных на рынке устройств, обладающих возможностями 3G и 4G, таких как iPhone, iPad и мобильные устройства на основе Android, и их быстрое распространение в корпоративных средах ускоряют переход к использованию IPv6. Однако отсутствие в этих устройствах должной защиты от вредоносного кода делает их уязвимыми к различным кибератакам. Зараженные устройства могут стать активными элементами ботнетов или использоваться для поддержки изощренных атак на обычные сети. В статье перечисляются проблемы безопасности IPv6, описываются сценарии потенциальных атак и предлагаются решения для борьбы с ними.

Последнюю статью номера написали Эми Шепански (Amy Szczepanski), Джиан Хуан (Jian Huang), Трой Байер (Troy Baer), Яшема Мек (Yashema Mack) и Шон Ахерн (Sean Ahern), она называется «Анализ данных и визуализация в высокопрозводительных вычислениях» (Data Analysis and Visualization in High-Performance Computing). В мире высокопроизводительных вычислений приложения анализа и визуализации данных долгое время считались второстепенными. Начало эпохи TeraGrid eXtreme Digital (2010 год) положило этому конец. Центр удаленного анализа и визуализации Университета Теннеси поддерживает среду NSF eXtreme Science and Engineering Discovery Environment, ранее носившую название TeraGrid, которая является крупнейшей в мире распределенной инфраструктурой открытых научных исследований. Она обеспечивает американских исследователей и преподавателей возможностями работы с огромными объемами информации, представленной в цифровой форме.

До следующей встречи, Сергей Кузнецов (kuzloc@ispras.ru).