На 15-м году существования компании Cognitive Technologies ее программа OCR CuneiForm для распо-знавания текстов снова становится ее флагманским продуктом. В конце 2007 г. было объявлено об открытии кода этой программы и мероприятии «Распознавание должно быть на каждом компьютере». В системе CuneiForm реализована одна из самых распространенных технологий распознавания текста, которой комплектовались многие модели сканеров компаний Hewlett-Packard, Canon, Mustek, Kodak, Fujitsu, Primetex, Olivetti и др.
Член-корреспондент РАН В. Л. Арлазаров, генеральный директор Cognitive Technologies, сообщил на пресс-конференции, что перед тем как начнется мероприятие, будет реализован проект по разработке в области Open Source, связанный с развитием CuneiForm. В ходе его любой желающий бесплатно получит этот программный продукт и, поскольку коды будут открытыми, то сможет принять участие в его доработке с учетом собственных потребностей. Что же интересного в данном проекте? Ведь известно, что разработки на основе открытого кода на ИТ-рынке привлекают к себе довольно большое внимание. Но если крупные компании вроде IBM и Hewlett-Packrd осуществляют в этом случае главным образом инвестиционную поддержку, то для перевода на другую платформу продуктов, в основе которых лежат технологии, требующие хорошей научной поддержки, решающим остается участие в ней ученых или наличие эффективной экспертизы. Cognitive Technologies уже участвовала в подобных проектах, в частности в рамках ФЦП «Электронная Россия» и для органов государственной власти.
Проект OpenSource в области технологий OCR компания проводит в три этапа.
На первом программа CuneiForm будет в свободном доступе (Freeware). Ее полная версия доступна широкому кругу пользователей начиная с 12 декабря 2007 г. Переписать ее можно будет на сайтах www.cognitive.ru , www.download.ru и www.freeware.ru.
На втором этапе будет подготовлен веб-ресурс www.cuneiform.ru, с помощью которого любой желающий сможет бесплатно распознать документ в онлайновом режиме. Доступ к ресурсу компания планирует обеспечить к концу января 2008 г., а к декабрю довести его производительность до 10 тыс. распознаваний документов в день.
На третьем этапе, в марте 2008 г., предполагается подготовить и разместить исходные коды OCR CuneiForm, а затем приступить к работе по подготовке новой версии программы с участием широких кругов ИТ-сообще-ства. С начала марта Cognitive Technologies будет выступать в качестве инвестора и координатора, а также предоставит научных экспертов. К 2010 г. компания надеется в результате осуществления программы «Распознавание должно быть на каждом компьютере» иметь в России долю рынка OCR-продуктов объемом 5—7% за счет оказания услуг, технической поддержки и рекламы.