Серьезная проблема многих промышленных предприятий — огромное количество бумажных документов, не позволяющее оперативно получать доступ к информации даже при наличии эффективной системы хранения. Перевод конструкторской, технической и технологической документации в электронный вид и создание электронного архива стали необходимыми условиями информационной поддержки работы предприятия.
Часто информация не приносит ожидаемой отдачи из-за сложности доступа к бумажным архивам и рабочей документации. Становятся необходимыми перевод конструкторской, технической и технологической документации в электронный вид, создание электронных архива предприятия, баз данных и картотек.
Преимущества электронного архива конструкторской и технологической документации перед архивом бумажным очевидны. Электронный архив позволяет принципиально решить проблему оперативного доступа. Эффективность использования документов многократно повышается за счет удобства электронного архива, возможности одновременной работы с одними и теми же документами, быстрого создания и анализа по заданному признаку подборок документов. Обеспечивается удаленный доступ к документам сотрудников территориально распределенных подразделений. Цифровые документы не разрушаются со временем и могут храниться практически вечно. Кроме того, решается проблема целостности документации: не секрет, что бумажные документы иногда бесследно пропадают в силу форс-мажорных обстоятельств или по злому умыслу, а при правильной организации хранения электронных документов их несанкционированные удаление и модификация невозможны.
Примеров создания и эксплуатации электронных архивов много. Бухгалтерии промышленных предприятий переводят свои документы в электронный вид для обеспечения быстрого доступа к ним, подготовки отчетности и аналитических подборок. Кадровые службы, особенно на крупных предприятиях, создают электронные картотеки персональных данных, которые требуется хранить в течение определенного законодательством срока. В системы автоматизированного проектирования переносится конструкторская и технологическая информация.
Для обработки накопленных массивов бумажной документации промышленным предприятиям зачастую выгоднее заказывать ее оцифровку у специализированных компаний. Выделение собственных ресурсов для создания непрофильного подразделения, которое по завершении работ придется расформировать или перепрофилировать, может оказаться непозволительной роскошью. Затраты на перевод документации в электронный вид силами самого предприятия могут оказаться в полтора-два раза большими; не исключено, что эту работу не удастся выполнить в срок.
Реализация крупных проектов перевода в электронный вид сотен тысяч и даже миллионов документов часто оказывается не под силу предприятиям даже при наличии соответствующих технических средств. Слишком велика в этом процессе роль методологии и опыта, слишком велик риск потери информации из-за человеческого фактора или сбоев оборудования. В таблице приведен примерный экономический расчет для проекта архивирования 11 млн. документов формата А4, включающего расшивку документов, их перевод в электронный вид, индексацию по дате создания и номеру и исчерпывающую верификацию.
Продолжительность этого проекта первоначально оценивалась в два года, но силами специализированных поставщиков работу его удалось выполнить за один год при стоимости 577 тыс. долл.
Даже при относительно небольшом объеме архива иногда выгоднее поручить его перевод в электронный вид стороннему исполнителю. В процессе выполнения работ могут обнаружиться множество статей расхода, которые не были предусмотрены или казались малозначительными. За планируемую сумму никто не сможет гарантировать получения результатов требуемого качества, а в случае с внешним подрядчиком оплачивается лишь конечный результат, а риск снижается.
Технология массового перевода документов в электронный вид подразумевает следующие этапы работы.
I. Документация переводится в электронный вид с использованием поточного сканирования. В результате создаются точные электронные копии документов со всеми артефактами (подписи, печати, штампы и т.д.).
II. Электронные документы подвергаются индексации по различным информационным полям (тип документа, номер дела, дата создания и др.). При необходимости электронная форма может быть дополнительно обработана: тексты распознаются, а графика (чертежи, схемы и т.п.) векторизуется, что позволяет сделать электронный документ математической моделью для применения в инструментальных средах или системах автоматизированного проектирования.
III. Документы заносятся в электронный архив, который в дальнейшем может стать основой для автоматизированной обработки всей технической и технологической информации компании.
Перевод документов в электронный вид
Для оцифровки большого объема документации используется профессиональное оборудование. Работа на простых планшетных сканерах может затянуться и не всегда обеспечивает надлежащее качество.
Листовые документы формата до А3 обычно сканируются на протяжных документных сканерах, которые, в зависимости от модели, обеспечивают оцифровку от 200 до 460 страниц в минуту. На одном сканере вполне реально переводить в электронный вид до 30 тыс. документов в день, причем профессиональное оборудование позволяет работать с ветхими и поврежденными документами.
Сшитые документы, книги, чертежи, крупноформатные документы, объемные предметы сканируются на планетарных сканерах. В этих устройствах сканируемый оригинал неподвижен и располагается лицевой стороной вверх на значительном удалении от оптической системы и сканирующей линейной матрицы сканера. Такой тип сканирования позволяет избежать контакта со сканирующими элементами и обеспечивает сохранность оригиналов. С помощью планетарных сканеров осуществляется высококачественная оцифровка документов, что особенно важно, например, при создании электронных библиотек чертежей.
На этом этапе выбираются оптимальные показатели сканирования — черно-белые или цветные образы, разрешение отсканированных документов, параметры постобработки образов.
Индексация документов
При кажущейся простоте процесс индексации документов сложен и с организационной, и с технологической точки зрения. В случае с большими документальными массивами автоматическое распознавание специальными программами применяется крайне редко: процент ошибок достаточно велик. Зачастую при индексации необходимо обеспечить не более одного ошибочного символа на 1 тыс. введенных — недостижимая пока точность для подобных систем. Поэтому отсканированные материалы обрабатываются поэтапно с помощью комбинации ручных и автоматических методов.
Таблица. Выполнение работ силами предприятия |
На первом этапе осуществляется предварительная подготовка. Отсканированные образы очищаются, специалисты подготавливают справочники и классификаторы, на основе которых будет проводиться обработка, создаются формы для заполнения.
На втором этапе составляются нормативы для операторов и задания для распределенной обработки. Документ разбивается на группы полей, за которые отвечают конкретные операторы, досконально изучившие нюансы их обработки. На этом же этапе осуществляется оптимизация — однотипные работы группируются.
Третий этап — многоступенчатая процедура верификации при помощи средств СУБД, подробного протоколирования работ и процедуры «двойного ввода» (два оператора вводят одну и ту же информацию, а затем эти варианты сличаются на предмет непротиворечивости). Потом информация в требуемом формате выгружается в результирующую базу данных.
Наполнение электронного архива
После перевода документов в электронный вид их можно занести в электронный архив. Например, на многих предприятиях уже существует информационная система (такая, как ERP), способная обрабатывать электронные документы.
Главное требование к электронному архиву — обеспечение сохранности документов. Должно быть предусмотрено системное ведение архива, включая сохранение всех версий документов после каждого изменения, без возможности уничтожения версий (только исключение из доступа). В электронном архиве необходимы и средства восстановления данных после сбоев. Немаловажным является обеспечение безопасности данных: профессиональная архивная система, во-первых, предоставляет доступ к документам строго в соответствии с политикой безопасности, а во-вторых, ведет подробный протокол работы с архивом.
Хранение электронного документа подразумевает хранение всех его атрибутов — подписей, печатей, пометок и т.д. При печати документа должен полностью сохраняться формат его вывода: пользователю необходима возможность сделать полный дубликат документа.
Система поддержки электронного архива должна обеспечивать максимально удобное универсальное представление документа в базе данных:
- документ должен снабжаться полной поисковой и атрибутивной информацией (карточка документа, строка SQL-таблицы);
- система должна поддерживать хранение связанных мультимедийных данных (видео, анимация, звук);
- формат представления электронных документов должен быть универсальным.
Если же информационная система предприятия не удовлетворяет требованиям архивного хранения данных, она обычно разрабатывается на основе какой-либо профессиональной системы управления электронным архивом и интегрируется в информационную систему предприятия. В дальнейшем электронный архив может стать основой для автоматизированной обработки всей технической и технологической информации компании.
Сергей Миронов (SMironov@elar.ru) — заместитель директора корпорации «Электронный архив» (Москва).
Архив для добывающих предприятий
Созданные несколько десятилетий назад документы по скважинам постепенно приходят в негодность, и их перевод в электронный вид становится единственной возможностью сохранить уникальные сведения. Для нормальной работы в современных условиях требуется создание электронных архивов.
Проект, реализованный корпорацией «Электронный архив» для одного из крупнейших российских нефтегазовых предприятий, предусматривал перевод в электронный вид 1,5 млн крупноформатных схем, чертежей и организационно-распорядительной документации. Эта информация представляла собой разрозненный массив документов разных типов и форматов (от А4 до рулонов А0). Сотрудники предприятия попытались сканировать документы собственными силами, однако вскоре руководство пришло к выводу, что столь большой и разнородный массив документов невозможно обработать без специального центра сканирования.
Действительно, качественно отсканировать 20 тыс. лент самописцев длиной до 7 м очень сложно: необходим не только высококачественное оборудование, но и опыт проведения таких работ. Могут возникнуть проблемы с переводом документов в электронный вид, с упорядочением массива электронных образов и созданием индексных полей.
Рис. 1. Документы скважин, созданные несколько десятилетий назад, постепенно приходят в негодность
Рис. 2. Фрагмент электронного архива геологоразведочной информации
Машиностроительный архив
Московское машиностроительное производственное предприятие «Салют» специализируется на изготовлении и обслуживании авиадвигателей, узлов и деталей для самолетов конструкторских бюро им. Сухого, Туполева, Бериева и Антонова. Картотека учета применяемости технологического оборудования ведется на предприятии с середины 50-х. За это время она разрослась до 300 тыс. документов, и работать с ней становилось все труднее. Было принято решение создать электронную картотеку.
Специалисты завода разработали требуемую структуру базы данных электронной картотеки, но базу данных еще предстояло наполнить. Перевод картотеки в электронный вид осложнялся ее неоднородностью: карточки были разного качества, встречались ветхие и поврежденные, выполненные на нестандартных бланках. В ряде случаев приходилось проводить мини-экспертизы для оценки и распознавания различных частей картотеки.
Существенные сложности возникли и с индексацией отсканированных документов. Многие поля содержали сложные комбинации цифр и букв (латинских и кириллицы), правильно разобрать которые оказалось непросто из-за неразборчивости почерка авторов. Многовариантность расположения данных некоторых полей карточек, присутствие нестандартных сведений, большое количество взаимосвязанных обозначений и т.п. — все это обусловило применение особых организационных и технических мер для повышения качества и оперативности работы. Важной задачей была тщательная верификация данных по ключевому полю «шифр инструмента» (единственному полю, уникально идентифицирующему инструмент), и были установлены особые требования к качеству — не более одного ошибочного символа на 1 тыс. введенных.
Реализация проекта собственными силами при отсутствии поточного сканирующего оборудования, выделенных сотрудников, технологий и специального программного обеспечения заняла бы несколько лет. Например, сканирование на обычном планшетном сканере потребовало бы два с половиной года.
После внедрения электронной картотеки на заводе «Салют» на порядок уменьшилось время поиска информации, появилась возможность одновременной работы с картотекой нескольких сотрудников. Кроме того, была создана система контроля за целостностью картотеки, существенно сократились трудозатраты на обслуживание и пополнение картотеки, удалось решить проблему нехватки свободного места в архивном хранилище.
Архив для проектировщиков
Среди нерешенных задач Рязанского государственного приборостроительного завода числились предоставление предприятиям-смежникам копий конструкторской документации и подготовка чертежей для загрузки в системы автоматизированного проектирования. Информационный ресурс предприятия состоял из 30 тыс. документов на различных носителях — кальке, синьке, пленке, бумаге.
Технология индексации |
Основной массив документов формата А4 и А3 сотрудники корпорации «Электронный архив» сканировали на территории завода, а документы формата А2, А1 и А0 перевозили в Центр сканирования. Были получены черно-белые графические образы конструкторской документации в формате TIFF, на основе которых проводилась индексация документов по полям «наименование документа», «обозначение документа», «количество листов», «номер листа». Затем была сформирована база данных с информацией о документах и ссылками на файлы с их графическими образами, а также создан массив файлов, содержащий растровые образы документов.