В конце января компания ABBYY представила новую версию своего серверного решения для распознавания документов и конвертации PDF-файлов — ABBYY Recognition Server 2.0. С весны 2006 года, когда Recognition Server был выпущен на рынок, число его пользователей по всему миру превысило две сотни; 130 из них — российские организации, в том числе такие крупные, как РЖД, «ВымпелКом», МТС, Xerox Россия. В 2007 году прирост клиентской базы составил 235%.
Во второй версии Recognition Server появился ряд нововведений. В частности, создан программный интерфейс на базе протоколов SOAP и HTTP, обеспечивающий возможность интеграции с удаленными приложениями и приложениями, построенными на других платформах. В результате Recognition Server теперь может использоваться и в качестве внешнего Web-сервиса.
Также появилась функция автоматического сохранения распознанных документов в библиотеку Microsoft Office SharePoint Server и интеграция с Microsoft Exchange Server. Последняя предполагает два режима работы — отправка входящих писем на Recognition Server и получение их обратно в распознанном виде либо распознавание и конвертация «на отрезке» между другими почтовыми клиентами или многофункциональными устройствами и получателем.
Расширилось число поддерживаемых форматов. К ним добавились PDF/A, DOCX и XLSX из Microsoft Office 2007, DjVu (технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов), а также новый тип сжатия PDF-файлов на основе технологии Mixed Raster Content.
Некоторые подвижки произошли и в отношении пользовательского интерфейса. Если в первой версии программы его просто не было, а весь процесс распознавания ограничивался перенесением документа в папку «Входящие» и получением результата в папке «Исходящие», то теперь появилась и так называемая «станция верификации», на которой производится редактирование результатов распознавания и, опционально, выполнение ряда правил.
Также возможно разделение пачек изображений, полученных при потоковом сканировании, на отдельные документы, настройка расписания для станций обработки, а также задание низшего приоритета работы станций по отношению к другим процессам, выполняемым компьютером. Такая функция, переводящая распознавание и конвертацию в фоновый режим, позволяет использовать для обработки обычные офисные ПК, а не серверы. Количество таких станций неограниченно, и сервер управления самостоятельно распределяет нагрузку между ними.
Кроме того, Recognition Server поддерживает многоядерность. В ходе его тестирования на многопроцессорной платформе Intel Xeon 7300 при увеличении числа ядер с одного до 16 наблюдался 12-кратный прирост производительности.
По мнению генерального директора ABBYY Россия Григория Липича, Recognition Server предназначен скорее для средних и крупных компаний, для которых его цена вполне приемлема (87 тыс. рублей за лицензию на сервис производительностью 25 тыс. страниц в месяц и 96 тыс. рублей — до 100 тыс. страниц). Впрочем, как утверждает директор по корпоративным продажам ABBYY Россия Юрий Корюкин, и малым компаниям стоит при необходимости приобрести продукт: инвестиции в него окупятся меньше чем за год.
О практическом применении Recognition Server рассказала руководитель проектов департамента информационных технологий и консалтинга Xerox Россия Ольга Ефимова. Здесь продукт использовался в ходе реализации двух крупных проектов: формирования электронного информационного ресурса для Счетной палаты РФ на основе ее архивного фонда (3 тыс. дел объемом более 570 тыс. страниц), а также создания электронной архивной системы для коммерческой компании (6,5 тыс. архивных единиц объемом более 650 тыс. страниц). Ефимова заявила, что благодаря использованию Recognition Server в первом проекте сроки выполнения были уменьшены вдвое, а экономия бюджета составила 7,8%, во втором срок реализации был сокращен на 20%.
Липич, сославшись на агентство Harvey Spencer Associates, заявил, что мировой рынок систем ввода документов уже достиг объема 1,5 млрд. долл., а к 2010 году он предположительно вырастет до 2,5 млрд. долл. Доля России в нем, по собственным оценкам ABBYY, исчисляется десятками миллионов долларов, и большая часть, по словам Липича, принадлежит его компании. При этом все больше пользователей вводят данные при помощи многофункциональных устройств (согласно Infotrends, 20-30% в 2007 году и, по прогнозам, более 50% в 2010-м). Липич заявил, что именно этот рынок, где функционал МФУ пока используется не в полной мере, и является целевым для Recognition Server.