Системы видеонаблюдения применяются давно и широко, однако для них характерны такие недостатки, как трудоемкость просмотра записанной информации при расследовании инцидентов, а также трудность постоянного слежения за изображениями, поступающими со множества камер. Так, когда в июле 2005 года в Лондоне, который в изобилии оснащен камерами видеонаблюдения, произошла серия терактов, потребовалось просмотреть 6 тыс. часов видеозаписей, для того чтобы выявить подозреваемых. При этом, по данным Национального института юстиции США, у большинства людей после 20 минут за монитором внимание снижается далеко за границы допустимого, и наблюдение, ведущееся выделенными и добросовестными операторами, не позволяет построить эффективную систему безопасности. Это происходит потому, что при просмотре таких «программ» отсутствуют интеллектуальные стимулы, имеющиеся в фильмах или телепередачах.
Компании давно ведут исследования в области компьютерного анализа видео, у IBM это проект Smart Surveillance System, ранее называвшийся PeopleVision. Объединение различных направлений исследований в рамках проекта и позволило создать систему Smart Vision Suite, которая развернута уже на нескольких объектах, в частности в городе Чикаго. Анализируя видеопотоки, поступающие со множества камер, эта система в реальном времени может распознавать объекты, например людей или автомашины, и сохраняет в базе данных информацию о них: цвет, расстояние, траекторию движения, время и др. Наличие подобных метаданных к видеофайлу позволяет в течение нескольких минут получить ответ на запрос типа «найти красный микроавтобус» с областью поиска в 1000 часов видеозаписи. Система может также анализировать поведение объектов, чтобы привлекать внимание операторов к отклонениям от стандартного поведения.
Старк описал случай из опыта эксплуатации чикагской системы. Оператор системы обнаружил, что около одного из важных городских объектов ночью на полчаса припарковался микроавтобус, из которого никто не выходил. Запрос к системе позволил обнаружить несколько подобных случаев за две недели, после чего информация была передана в ФБР и оказалась полезной.
Подобные видеосистемы обрабатывают очень большие объемы данных. Так, всего только 500 городских камер, по оценкам IBM, генерируют 24 млн событий и 500 Гбайт данных в сутки. Если хранить информацию в течение пяти недель, это будет 840 млн событий и 16 Тбайт данных. Старк отметил, однако, что архитектура Smart Vision Suite не ограничивает число подключаемых камер и что имеющиеся внедрения насчитывают несколько тысяч камер.
Мощь видеоаналитической системы IBM значительно возрастает, если воспользоваться предусмотренной возможностью интеграции с системами, которые регистрируют информацию, поступающую от различных датчиков (например, от автомобилей, передающих по радио свои координаты). О возможностях и ограничениях систем видеоаналитики см. «Видеоаналитика: мифы и реальность», Computerworld Россия, № 22, 2008.