Компания «Гарант-Парк-Интернет» активно действует на рынке предоставления веб-услуг. Наряду с этим она выступает (www.metric.ru) и как разработчик программных средств полнотекстового поиска и анализа неструктурированной информации (RCO). В сентябре было объявлено, что вышла версия 3.0 ее продукта RCO Semantic Network, предназначенная для аналитической обработки текста на русском языке. Программа позволяет аналитикам при разборе текста в ходе разведывательного мониторинга с помощью компьютера уделить больше внимания объектам — персонам и организациям. С помощью используемых при этом алгоритмов удается с достаточно высокой точностью не только распознавать, но и отождествлять их различные обозначения, в том числе краткие и косвенные наименования. Основной набор функций RCO Semantic Network 3.0 обеспечивает выделение элементов смысла текста, их связей и построение различного вида дайджестов (контентно-зависимых описаний), что делает целесообразным его применение в системах мониторинга активности целевых объектов, автоматизированного сбора информации к досье.
С алгоритмической точки зрения, как утверждает ведущий разработчик Александр Ермаков, данный продукт решен таким образом, что в тесте можно эффективно проводить бессловарное выделение обозначений персон и организаций, число которых потенциально неисчислимо и которые могут обозначаться разными способами. Если же их подробное описание уже известно, реализуется более тонкое выделение объектов, например персон с одинаковыми ФИО, должностями и т.п. Отождествление различных наименований, иногда даже выраженных местоимениями, вместо объектов производится на основе анализа проблемы кореферентности.
Продукт RCO Semantic Network 3.0 поставляется в виде динамической библиотеки (DLL) для Windows, благодаря чему анализ текстов доступен с помощью пользовательских приложений. Таким образом, теперь в информационном поле отслеживаются и классифицируются все упоминания об объектах, устанавливаются их связи с другими объектами и событиями, а также составляются различные дайджесты. Наряду с этим библиотека используется при решении задач построения информационных портретов документов, их автоматической классификации, рубрикации, экспресс-анализа и визуализации больших массивов документов.
Сведения о продукте, включая документацию, можно найти на сайте www.rco.ru.