При поиске сведений из открытых источников часто возникает необходимость в семантической фильтрации полученных данных, однако из-за большого объема выполнить ее вручную не представляется возможным. Тем не менее имеется пул инструментов анализа текстовых данных, позволяющих автоматизировать процессы семантической фильтрации текстов.
В основе классической ИТ-архитектуры лежат приложения, каждое со своей базой данных, что обычно приводит к дублированию информации в бизнес-объектах. Ядро дата-центричной архитектуры – данные, доступные всем потребителям через единую точку, роль которой в сложных системах исполняет логическая витрина основанная на модели консолидированных данных. В чем преимущества использования онтологий для построения такой модели и как построить онтологическую модель, обеспечив гибкость и целостность?
Телекоммуникационные системы постоянно усложняются как с точки зрения функциональности, так и с точки зрения реализуемых бизнес-процессов, что требует наличия единой информационной модели предметной области и обеспечения взаимодействия различных информационных систем. Традиционные подходы к проектированию, ориентированные на построение систем, решающих частные задачи, не применимы. Требуется онтологическая модель телекоммуникационной сети, которая может использоваться как операторами связи для решения поисковых, аналитических и прогнозных задач, так и архитекторами при проектировании и модернизации телекоммуникационных систем.
Все, что можно автоматизировать, должно быть автоматизировано с одновременной оптимизацией бизнес-процессов. Однако нишевая автоматизация не может стать основой интеграции, необходима гиперавтоматизация, получившая реальное подкрепление в виде онтологического подхода к описанию предметной области и графовых баз, как адекватный инструмент реализации масштабных проектов.
Объединение событийного подхода, семантики и ориентированного на данные принципа управления дает бизнес-пользователям возможность декомпозировать автоматизируемую предметную область не с помощью традиционных языков программирования, а путем описания операций бизнес-деятельности на языке событий, происходящих во времени. По сути, речь идет о технологии low-code/no-code, в которой исполняемым «кодом» являются последовательности семантически определенных записей.
Процесс цифровизации может потребовать достаточно продолжительного времени для преобразования модели управления организацией, включая управление всей доступной информацией. Успех прохождения этого периода во многом зависит от учета тенденций в управлении знаниями, затрагивающих как новые технологии, так и способы их внедрения в реальные бизнес-процессы компании.
Набирает популярность семантическая разметка, используя которую поисковые системы адекватно отображают содержимое сайтов, однако большинство инструментов работы с контентом веб-страницы актуальных данных из различных веб-ресурсов достаточно сложны и требуют программирования. Инструмент StructScraper, использующий микроразметку сайтов, позволяет создавать страницы с семантической информацией и метаданными от внешних сайтов с наполнением непосредственно на момент обращения.
Современные онтологические технологии, графовые базы данных, машины логического вывода и другие инструменты дают возможность в рамках разумных бюджетов создавать логические витрины данных, позволяющие предприятиям консолидировать все имеющиеся у них данные. Проекты создания автоматизированных систем, построенных по архитектуре логической витрины данных, сегодня можно выполнить на базе ПО с открытым исходным кодом, а также продуктов, внесенных в Реестр отечественного ПО.
Компании, способные с помощью графов знаний управлять сложностью своих информационных систем, получат преимущества в условиях цифровой экономики.
29 ноября 2018 года эта тема подробно обсуждается на конференции "Технологии управления данными 2018"
ИТ-индустрия ищет сегодня решение задачи обработки возрастающих объемов данных, однако, несмотря на приобретение нового оборудования и развертывание дополнительных сетей, компании не замечают, что сражаются с ветряными мельницами, — завтра данных будет еще больше. Тем не менее вопрос о том, как заставить все эти данные приносить реальную пользу бизнесу, редко оказывается в фокусе внимания ИТ-подразделений. Утилизовать данные путем интеграции помогут семантические технологии.