Компания «СофтИнфор», специализирующаяся на разработке систем полнотекстового поиска информации, провела презентацию, посвященную роли поисковых технологий в обеспечении информационной безопасности, а также рассказала о системе выявления плагиата в текстах — «Плагиат-Информ».
Важным аспектом защиты от утечки конфиденциальной информации является возможность оперативного анализа данных, которые могут покинуть пределы информационного пространства компании разными путями: по каналам передачи данных (в виде электронных писем или мгновенных сообщений), на съемных носителях, в виде распечатки. Как указывают в «СофтИнформе», одним из необходимых условий для качественного анализа является возможность полнотекстового поиска, причем не простого поиска по словам и словосочетаниям, а позволяющего учитывать близость определенных слов в документе и выявлять похожие фрагменты текста.
Программный комплекс обеспечения информационной безопасности, предлагаемый «СофтИнформом», основан именно на таком мощном поисковом механизме — SearchInform Server, выполняющем фразовый поиск и поиск похожих фрагментов с использованием в качестве запроса целых абзацев. Другими компонентами системы являются программы MailSniffer, IM Sniffer, Print Sniffer и Device Sniffer, отвечающие, соответственно, за перехват и анализ данных, поступающих по электронной почте, через системы быстрого обмена сообщениями, выводимых на принтер и записываемых на носители. Роль связующего звена системы выполняет SearchInform Alert Center, который опрашивает компоненты, отвечающие за перехват, и при обнаружении определенных ключевых слов, фраз или абзацев извещает об этом сотрудника, ответственного за информационную безопасность.
По словам директора «СофтИнформа» Льва Матвеева, такое негласное отслеживание передаваемой информации зачастую оказывается гораздо эффективнее, чем блокирование ее копирования или пересылки, которое от пользователя нельзя скрыть.
На уже упомянутом механизме поиска основана и система выявления плагиата «Плагиат-Информ», предназначенная для вузов. Она позволяет осуществлять сравнение анализируемого документа с содержимого соответствующей «библиотеки», куда могут быть включены как тексты (рефераты, курсовые работы и т. п.), публикуемые в Internet, так и документы пользователя: работы, сдаваемые в пределах данного вуза или объединения вузов.
Запатентованный алгоритм анализирует структуру текста и позволяет находить схожие фрагменты даже в том случае, если абзацы были переставлены, слова заменены синонимами, а часть текста переписана.
Программа обеспечивает структурированный вывод информации об использованных источниках, а также демонстрирует степень похожести фрагментов (вплоть до отдельных абзацев) анализируемого документа на источники. Для наглядности одинаковые фрагменты текста выделяются цветом. Система также может использоваться для определения индекса цитирования конкретного автора в научных работах.
«Плагиат-Информ» версии 1.3 поддерживает три степени глубины проверки работ на плагиат. Быстрая проверка используется для предварительной оценки работ, а также позволяет сразу определить, какие работы являются неприкрытым плагиатом. Проверка в режиме smart позволяет более тщательно проверить работу и выявляет факт плагиата даже при серьезной редактуре текста и составлении работы из разных источников. Наконец, углубленная проверка позволяет получить максимально детализированный отчет об источниках, из которых производились заимствования информации.
«Плагиат-Информ» выпускается в трех редакциях: коробочной, корпоративной (для одного вуза) и межвузовской.