Внедрение продукта в сознание должно начинаться с того, что он из себя представляет. Мы сортируем и храним информацию по категориям. Если вы не укажите четко будущему покупателю категорию продукта, ваши шансы закрепиться в его или ее сознании или очень малы, или равны нулю.
Джек Траут. Большие проблемы больших брендов
Дифференциация программных продуктов по цене, функциональности и предполагаемой аудитории — те излюбленные грабли, на которые наступают маркетологи. Всякому очевидно, что большинство домашних пользователей не знают и слов-то таких, как «домен» и Exchange. Значит, если такие названия им неизвестны, то они, судя по всему, и не нуждаются в этом. Однако чем более прикладным является ПО, тем более глухими становятся дебри. А когда встает задача сделать продукт в 2—3 раза дешевле за счет отбрасывания нескольких общеупотребительных функций, тогда-то и начинается «веселье». Если оставить не те «фишки», рухнут продажи полновесного пакета, если же перестараться с ножницами, потенциальные покупатели отправятся в пиринговые сети за большей экономией. Потому что pro-версия дорогая, а от урезанной мало толку, да еще и денег за нее попросят. Так что подробное рассмотрение подобных курьезов лучше оставить для юмористической брошюры по маркетингу и сосредоточиться на конкретном примере: домашний пользователь против бюджетных OCR-решений компании ABBYY.
Участники теста. В роли главного претендента на приз читательских симпатий (или антипатий) выступает ПО FineReader 10 Home Edition. А весьма похожим на него решением в отношении функциональности и стоимости, но предназначенным для платформы Apple Macintosh, является пакет FineReader Express Edition for Mac. Обе программы, относящиеся к одной ценовой категории — «менее 3000 руб.», лишены значительной доли возможностей профессиональной версии. Кроме того, их сходство становится заметным буквально с момента запуска — в качестве интерфейса в обоих продуктах предлагается только стартовое окно с типовыми задачами.
Система распознавания FineReader 10 Home Edition, помимо всего прочего, не умеет работать с файлами PDF и DjVu, а также лишена функций редактирования. А ее версия для Mac отличается в лучшую сторону лишь возможностью открывать файлы формата PDF. Таким образом, набор функций FineReader 10 Home Edition ограничивается распознаванием нужных страниц в документе и базовой разметкой областей на листе. А теперь разберемся, в каких ситуациях этого будет достаточно, для чего прежде всего обсудим качество и скорость распознавания.
Условия испытаний. Для проведения первого тестирования системы мы выбрали книгу, содержащую текст на нескольких языках, включая русский (в том числе и с дореволюционной орфографией). Она была отсканирована не с самым высоким разрешением и помещена в контейнер PDF. Сразу же выяснилось, что, поскольку PDF не открывается напрямую, необходимо конвертировать все 368 страниц издания в последовательность JPEG/PNG-файлов. Причем желательно без лишней компрессии, ибо качество и так не блещет. Более неудобного сценария для работы и не придумаешь — вместо одного 20?Мбайт файла получилось около 400 картинок суммарным объемом 120 Мбайт. Кроме того, невозможно явно указать нужные языки в Windows-версии. А в нашем случае требуются русский, английский, немецкий плюс старая орфография для русского. Вариантов же всего два: либо один язык на выбор, либо автоопределение из списка, где никакой старой орфографии нет. Вывод неутешителен: страницы со старой орфографией приходится распознавать отдельно.
Чтобы оценить производительность обеих версий программы, мы обработали с помощью каждой из них по 100 страниц выбранного нами издания. На рабочей станции Mac Pro с четырехъядерным процессором Intel Xeon под соответствующей ОС Windows-версия прошла тест на 25?% быстрее, чем предназначенная для Mac, и обеспечила несколько более качественное распознавание.
Естественно, такое сравнение решений, различающихся по степени актуальности промежутком в год, не совсем корректно. Однако на рынке в определенном ценовом сегменте и для данных платформ приходится выбирать именно между этими вариантами.
И тогда стоит вспомнить о вырезанных из «домашнего» варианта возможностях. Ведь если для Mac версия Express — единственная и безальтернативная, то пользователям Windows предлагаются Home и Professional. Оправдывает ли урезанная функциональность трехкратную экономию денег? На мой взгляд, нет, но лишь до тех пор, пока лицензия явно допускает только домашнее применение продукта.
Офисная жизнь. Попробуем разобраться почему. Видимо, потому, что столь простой и недорогой вариант поставки оказался бы идеальным для большинства среднестатистических офисов. Именно в таком режиме там используют любой инструмент OCR — для обработки небольших документов напрямую со сканера/камеры или из почтового вложения. Ни сотен страниц, ни нескольких языков, ни форматов PDF и DjVu. В повседневном документообороте организации, работающей в области, отличной от лингвистики или полиграфии, куда чаще встречаются договоры на пару страниц, накладные или банковские реквизиты.
А вот в домашних условиях все совершенно наоборот. Кому там в первую очередь нужны средства OCR? Как правило, учащимся, научным сотрудникам, фрилансерам, работающим с текстами. Все эти категории пользователей сталкиваются с огромными объемами текста. Как давно вы видели в Интернете отсканированную книгу в виде 400 файлов JPEG? Вот и мне они как-то нечасто встречаются. Подавляющая масса материалов представлена в форматах PDF или DjVu. И даже если пользователь решит оцифровать книги из собственной библиотеки, вряд ли ему придет в голову распознавать напрямую со сканера или генерировать сотни и тысячи отдельных файлов. Те же файлы PDF и DjVu обрабатывать гораздо практичнее.
* * *
Новый бюджетный FineReader радует скоростью и качеством распознавания. Однако перечень угодивших под нож функций вызывает недоумение. Ладно редактор, в принципе можно как-то обойтись без предварительного просмотра и проверки орфографии. Но работать с объемными файлами без поддержки соответствующих форматов и ручного выбора языков решительно невозможно. А вот тому, кому действительно требуется инструмент для распознавания небольших объемов за умеренную цену, «домашняя» версия FineReader 10 обеспечит великолепное качество распознавания и высокую производительность. Тем же, кто имеет дело с книгами, потери времени от возни с конвертациями и сотнями отдельных файлов не компенсирует даже самая высокая скорость работы приложения.
Что же касается версии для Mac, то отраден уже сам факт ее выхода спустя столько лет после предыдущей. Тем более что и выбирать особо не приходится — единственный конкурент в лице I. R. I. S. с кириллицей функционирует значительно хуже. Однако, полагаю, все же есть возможность повысить производительность и улучшить качество распознавания в ABBYY. И новая линейка продуктов для Windows — наглядное тому подтверждение.
Системные требования: процессор с тактовой частотой 1 ГГц или выше, 512?Мбайт ОЗУ, видеосистема, поддерживающая разрешение 1024×768 точек при отображении 65?536 цветов, 350 Мбайт (для обычной установки) и 650 Мбайт (для работы программы) свободного дискового пространства, TWAIN- или WIA-совместимый сканер, цифровой фотоаппарат или факс-модем, мышь. Программа работает в среде Windows XP/Vista/7.
Разработка и издание: ABBYY
FineReader Express Edition for Mac
Системные требования: процессор Power PC или Intel, 256?Мбайт ОЗУ, видеосистема, поддерживающая разрешение 1024×768 точек при отображении 65 ?536 цветов, 1 Гбайт свободного дискового пространства, TWAIN-совместимый сканер, цифровая камера или факс-модем, мышь. Программа работает в среде Mac OS X 10.4, 10.5, 10.6 (поддержка как Power PC, так и Intel).
Разработка и издание: ABBYY