«Мы имеем возможность объединять пространственные данные с очень сложной структурой, трудные в обработке, — заявил Дейн Коер, генеральный директор SpaceCurve. — Наше программное обеспечение способно непрерывно принимать большие объемы геопространственной информации, предоставляя пользователям возможность следить за нею и опрашивать ее».
По оценке аналитиков Gartner, сейчас около 80% всех данных имеют какие-либо геопространственные элементы. Но, по сведениям Коера, на сегодня практически нет программных средств уровня предприятия, способных извлекать из таких данных максимум пользы.
Традиционные СУБД и даже более новые системы Больших Данных не оптимизированы для быстрого анализа геопространственной информации, хотя почти все подобные решения имеют какой-то уровень поддержки работы с нею. И, хотя недостатка в географических информационных системах сейчас нет, они не рассчитаны на обработку колоссальных объемов показаний датчиков, объединенных в сенсорные сети в стиле Интернета вещей.
Специалисты SpaceCurve разработали семейство алгоритмов, упрощающих разбор географических данных, и реализовали с нуля движок базы данных, оптимизированный для распараллеленного выполнения на группе серверов.
По словам Коера, результатом стала система, которая, в отличие от Hadoop и подобных, может опрашивать потоки данных, поступающие в режиме реального времени, причем обходится она в разы дешевле, чем решения для анализа данных в оперативной памяти вроде Oracle TimesTen.
По убеждению Коера, у системы SpaceCurve — широкий круг потенциальных применений. Операторы связи, к примеру, смогут пользоваться ею для мониторинга перемещений абонентов в режиме реального времени. Систему также можно применять для обработки «цунами» информации, поступающей от удаленных сенсорных сетей.
В качестве примера Коер показал, как SpaceCurve наглядно отображает информацию о движении транспортных средств в Сиэтле одновременно со сводками демографических сведений по всем, кто в них едет, — для этого данные из журналов операций базовых станций сотовой связи сопоставлялись со статистикой бюро переписи населения.
SpaceCurve позволяет получать данные из источников, поддерживающих REST-запросы, и может работать с форматами JSON и ArcGIS.
«Для любой технологии, предоставляющей возможность использования геоданных с целью оптимизации процессов и повышения результативности, можно предложить массу сценариев применения, обеспечивающих отличную окупаемость», — полагает Том Петрочелли, аналитик компании Neuralytix по социальным, мобильным и облачным приложениям для предприятий.
Способность обрабатывать огромные объемы данных в реальном времени обещает SpaceCurve рыночные преимущества. Система подобного рода позволит, к примеру, организовывать крупномасштабные маркетинговые кампании, в ходе которых покупатели будут узнавать о распродажах, просто проходя мимо магазинов, отметил Петрочелли.
Геоинформационных систем и СУБД с поддержкой геопространственных данных существует немало. В частности, система IBM InfoSphere Streams тоже предлагается в качестве решения для анализа огромных объемов геопространственных данных «на лету». Но поскольку подобные технологии отличаются новизной, пока еще рано говорить о том, какой из подходов работает лучше, считает Петрочелли.
У SpaceCurve уже есть ряд заказчиков в различных отраслях, в том числе компания Socrata, разрабатывающая ПО для госструктур; Dyn, разработчик ПО управления производительностью ИТ-систем; Via Informatics, провайдер сервисов анализа геопространственной информации.
Компания SpaceCurve, основанная в 2009 году, с тех пор получила значительный объем инвестиций от целого ряда фондов, в их числе Reed Elsevier Ventures и Divergent Ventures. Она заключила партнерские договоры с несколькими компаниями, работающими в сфере геоинформационных систем, такими как AirSage, предоставляющая услуги анализа данных из сотовых сетей, системный интегратор L3 и Esri, ведущий разработчик ГИС.
SpaceCurve работает под Linux и может выполняться в облачных инфраструктурных сервисах, например в облаке Amazon.