Подобный подход раз за разом приносит свои плоды — новая версия программы добросовестно истребляет появившийся за год-другой прирост вычислительной мощности ПК, выглядит более современной и обычно представляется разработчиком как актуальная. Вывод не склонного к «особой» вдумчивости пользователя таков: надо брать.
Вот и рассматриваемая в данной статье программа ABBYY FineReader 9 Professional на диво неоднозначный продукт. С одной стороны, пакет содержит весьма эффективные, оригинальные и рациональные новые технологии, с другой –- его потенциал можно попросту не заметить из-за далекой от совершенства реализации. Впрочем, обо всем по порядку.
Тропами маркетинговой шелухи
Пресс-релизы компании ABBYY представляют внушительный объем новаций свежей версии флагманского продукта. Вот основные из них:
-
концепция Document OCR — отныне программа рассматривает совокупность исходных изображений не просто как очередь на распознавание, а как целостную структуру с единым оформлением, набором шрифтовых гарнитур, сносками, колонтитулами и проч.;
-
возможность передачи проекта для дальнейшей обработки в наиболее подходящее к содержанию документа приложение из состава Microsoft Office: Word, Excel, Outlook — либо сохранение в одном из многочисленных форматов, включая doc(x), xls(x), pdf(/a);
-
оптимизация для многоядерных систем;
-
расширенные сетевые возможности, включая проверку удаленных папок по расписанию;
-
мощная система сценариев;
-
традиционно дружелюбный интерфейс, максимально упрощающий режимы быстрого распознавания несложных документов высокого качества;
-
наконец, значок Vista Certified, без которого, видимо, не сможет ныне обойтись даже программа для тотальной деинсталляции разом всей продукции компании Microsoft.
Вот и познакомились!
Очная ставка с продуктом поначалу оставляет сумбурное впечатление. Первые полчаса работы с новым FineReader неизбежно приходится посвящать поединку «Пользователь vs «дружелюбный» интерфейс», попыткам постичь дзен технологии Document OCR и систематизировать весьма неоднозначные результаты экспериментов с новыми возможностями распознавания документов. Нет, конечно же работа со свежеотпечатанными тремя страницами текста, набранного гарнитурой Times, 14-м кеглем, без таблиц, сносок и нестандартных элементов оформления проходит на привычное троекратное «ура», как и в предыдущих версиях. А вот обработка, скажем, отсканированной газеты –- дело куда более любопытное именно в версии 9, ведь она, если верить пресс-релизам, подобную рутину должна в значительной степени автоматизировать. В версии 8 распознавание документов со сложной структурой проще полностью делать вручную. Предполагалось, что работа со сложными документами в новом FineReader будет заключаться в том, чтобы, само сабой, распознать отдельные слова без ошибок, а также сохранить в файле или передать в нужное приложение документ, максимально близкий по оформлению к исходному. Для этого есть масса ухищрений, включая отдельные типы данных (текст, таблицы, картинки), подстановку шрифтов схожей гарнитуры и т.п. Однако реализация данной модели пока далека от идеала.
Прекрасно обрабатывался документ, состоящий из текста, таблиц, печати и подписей, –- данные всех типов корректно определились, таблица передалась в Word без искажений и картинки с подписями установились в нужных местах. Газета же, в которой были применены разные шрифты, имелось множество рисунков и врезок, превратилась в настоящую кашу. Ее куда дольше и сложнее доводить до требующегося вида, чем распознавать фрагменты текста по отдельности и размещать в положенные места. Кстати, работать с изображениями и переносить их в новый документ здесь весьма удобно. Естественно, не слишком сложное распознавание и перенос прайс-листа в Excel выполняются практически безупречно. Правда, при распознавании таблицы FineReader добавляла пустые ячейки с очерченной границей там, где в оригинале никаких границ и в помине не было.
В общем, механизм распознавания в версии 9 значительно улучшился, однако он все же не очень удобен. Да и разделения уровней сложности в интерфейсе не наблюдается – даже при совершении тривиальных операций зачастую трудно разобраться в пестром разнообразии вариантов. Полагаю, при таком изобилии возможностей, нередко совершенно ненужных при осуществлении типовых операций с несложными документами, следовало бы все же предусмотреть побольше готовых сценариев для простых операций одним щелчком.
Такие сценарии – это по сути средства автоматизации действий, которые пользователь может реализовывать и редактировать. Сценарии организуются в простой и наглядной форме, и потому легко создать базу типовых наработанных процедур, что существенно упростит работу. К сожалению, почему-то в комплекте поставки они представлены лишь в виде куцего набора, хотя с их помощью можно сделать систему пригодной для любого начинающего.
Удручает также и убогий список поддерживаемых приложений. Отчего, например, наряду с Microsoft Office не в полной мере поддерживается OpenOffice.org, если известно, что открытый офисный пакет в Windows-ипостаси работает и с COM, и с OLE, а значит, интегрировать его поддержку было бы не труднее, чем обеспечить имеющуюся интеграцию с коммерческим пакетом. Такая недоработка особенно удивляет, ведь FineReader российского происхождения.
В последние два года OpenOffice активно внедряют на российских предприятиях в качестве бесплатной замены дорогого продукта компании Microsoft, причем, этим занимаются, как правило, организации, заботящиеся о лицензионной чистоте ПО. Однако отмечается одна странность: именно их игнорирует ABBYY, весьма заинтересованная в уменьшении количества пользователей нелицензионного офисного ПО.
Уживемся?
Впрочем, как уже описанные, так и пока не подвергшиеся обсуждению досадные огрехи у этого долгожданного продукта все же не способны перевесить многочисленные улучшения и расширившуюся функ-циональность. В общем, переходить на версию 9 с 8-й и более ранних, несомненно, стоит, но… если удастся. Это вопрос особый, и не из веселых. Судите сами. Можно удобно работать с документами среднего объема (до 30 стр.) в FineReader 8 даже на Pentium III с 256-Мбайт ОЗУ и более. Чтобы версия 9 функционировала с такой же скоростью, требуется не менее 1-Гбайт ОЗУ и процессор AMD 64 или лучше. Система такой конфигурации превышает указанные минимальные требования в 2 раза, что подтвердили результаты многочисленных тестов, проведенных в двух режимах. В первом (основном) гостевая Windows XP работала в среде ОС Linux в виртуальной машине с процессором AMD Athlon 64 X2 6400, которой последовательно выделялось от 256 до 2048 Мбайт памяти. Поскольку такой процессор даже при виртуализации для пакета явно избыточен, то зависимость производительности от объема памяти можно считать основным результатом данного теста. При работе с документами, оформленными не слишком сложно, объемом менее 30 стр. необходимо как минимум 1-Гбайт ОЗУ. Второе тестирование производили уже «на железе». Были использованы Windows XP SP2, процессор Intel Core 2 Duo E6750 и ОЗУ объемом от 512 Мбайт до 4 Гбайт. Допустимый для комфортной работы объем ОЗУ — 1024 Мбайт, а для больших проектов вроде 300-страничной научной работы в формате PDF производительность зависела от памяти вплоть до 2 Гбайт.
Естественно, что подобным требованиям не всегда отвечает обычный офисный ПК. Следовательно, для обработки сложной документации большого объема имеет смысл устанавливать FineReader версии 9 тем пользователям, у которых существенная экономия времени помогает быстро окупить расходы на оборудование.
Обобщая изложенное, можно сделать вывод, что новая версия продукта ABBYY — достойная замена предшествующей. У нее значительно улучшилось качество распознавания, она способна поддерживать новые форматы документов и обладает широкими возможностями автоматизации. Кроме того, улучшилась работа со снимками, сделанными с документов. Нередки случаи, когда под рукой нет сканера, а есть мобильный телефон с фотокамерой. И тогда версия 9 поможет обработать полученное изображение. Здесь-то и пригодятся подробные инструкции, составленные разработчиком. Кстати, таких полезных функций в FineReader 9 достаточно, чтобы сделать ее весьма гибкой и эффективной. А поскольку вычислительная техника быстро дешевеет и офисные ПК постоянно улучшаются, то вполне вероятно, что повышенные требования программы к оборудованию менее чем через год станут вполне приемлемыми.
ABBYY FineReader 9
Системные требования: Pentium 4-1000, 512-Мбайт ОЗУ, видеосистема, поддерживающая разрешение 1024×768 точек при отображении 65 536 цветов, мышь, 512 Мбайт свободного дискового пространства, TWAIN- или WIA-совместимый сканер, цифровая камера. Программа работает в среде Windows Vista/Server 2003/XP/2000.
Разработка: ABBYY
Издание: ABBYY