Компания IBM провела презентацию продукта IBM Content Analytics. Эта система для поиска и анализа неструктурированной информации выпущена на мировой рынок в ноябре прошлого года, на российский — весной текущего. Внедрений системы в России пока нет, но интерес значительный, как отметил на презентации Дмитрий Лактионов, руководитель направления по развитию управления информационными ресурсами предприятия IBM в России и СНГ, тем более после громкого успеха «интеллектуального» суперкомпьютера Watson, в основе работы которого как раз и лежит ПО Content Analytics.
По словам Лактионова, сегодня широко признается важность поиска эффективных механизмов анализа неструктурированных данных, объемы которых во всей совокупности накапливаемой цифровой информации значительно превышают объемы структурированных. Чтобы решить эту задачу, необходимо построить мост между естественным языком и языком компьютера, трансформировать сложные высказывания в четкие понятия и сущности, которые способна понять и проанализировать машина.
Анализ больших объемов текстовых документов на базе специальных механизмов, задаваемых специалистами, довольно давно реализован IBM в системе OmniFind. Решение Content Analytics идет дальше, предлагая возможность поиска и анализа неструктурированной текстовой информации простыми способами, доступными широкому кругу пользователей. В основе системы лежит механизм текстовой аналитики, вычленяющий в текстах заданные понятия и определенные типы информации для последующего анализа. Как поясняют в IBM, продукт Content Analytics может применяться для выявления тенденций, типовых моделей поведения, статистических взаимосвязей, обеспечивая быструю и эффективную обработку очень больших объемов документов, записей в блогах и форумах, преобразованных в текст аудиозаписей и т. д. Среди примеров использования системы — анализ обращений по качеству медицинского обслуживания в США, повлекший за собой санкции в отношении одного из производителей медицинского оборудования; повышение качества работы контактного центра крупного оператора на основе анализа обращений абонентов.
Для продвижения на российский рынок в продукте локализованы базовые аспекты поддержки языка. Применение системы в конкретных отраслях требует ее настройки на специфику той или иной индустрии или научной области, для чего в Content Analytics предусмотрен специальный механизм, который может использовать либо сам заказчик, либо партнер IBM, осуществляющий внедрение.