В компании уверены: у системы SpaceCurve широкий круг потенциальных применений Источник: SpaceCurve |
Системы вроде Hadoop и Spark справляются с управлением огромными объемами информации, но инструментов для ее разбора и анализа пока не хватает. Компания SpaceCurve, стартап всего с двухлетней историей, выпустила новую СУБД, обеспечивающую возможность оперативного анализа географических данных по мере их поступления.
«Мы имеем возможность объединять пространственные данные с очень сложной структурой, трудные в обработке, — заявил Дейн Коер, генеральный директор SpaceCurve. — Наше программное обеспечение способно непрерывно принимать большие объемы геопространственной информации, предоставляя пользователям возможность следить за нею и опрашивать ее».
По оценке аналитиков Gartner, сейчас около 80% всех данных имеют какие-либо геопространственные элементы. Но, по сведениям Коера, на сегодня практически нет программных средств уровня предприятия, способных извлекать из таких данных максимум пользы.
Традиционные СУБД и даже более новые системы Больших Данных не оптимизированы для быстрого анализа геопространственной информации, хотя почти все подобные решения имеют какой-то уровень поддержки работы с нею. И, хотя недостатка в географических информационных системах сейчас нет, они не рассчитаны на обработку колоссальных объемов показаний датчиков, объединенных в сенсорные сети в стиле Интернета вещей.
Специалисты SpaceCurve разработали семейство алгоритмов, упрощающих разбор географических данных, и реализовали с нуля движок базы данных, оптимизированный для распараллеленного выполнения на группе серверов.
По словам Коера, результатом стала система, которая, в отличие от Hadoop и подобных, может опрашивать потоки данных, поступающие в режиме реального времени, причем обходится она в разы дешевле, чем решения для анализа данных в оперативной памяти вроде Oracle TimesTen.
По убеждению Коера, у системы SpaceCurve широкий круг потенциальных применений. Операторы связи, к примеру, смогут пользоваться ею для мониторинга перемещений абонентов в режиме реального времени. Систему также можно применять для обработки «цунами» информации, поступающей от удаленных сенсорных сетей.
Геоинформационных систем и СУБД с поддержкой геопространственных данных существует немало. В частности, система IBM InfoSphere Streams тоже предлагается в качестве решения для анализа огромных объемов геопространственных данных «на лету». Но поскольку подобные технологии отличаются новизной, пока еще рано говорить о том, какой из подходов работает лучше.
SpaceCurve работает под Linux и может выполняться в облачных инфраструктурных сервисах, например в облаке Amazon.