Исследователи из компании Smart Engines и ФИЦ ИУ РАН обучили искусственный интеллект извлекать содержимое хрупких свитков, не разворачивая их. Восстановленный текст из манускрипта можно получить нажатием одной кнопки. Ученые смогут изучать тексты бумажных, берестяных и серебряных свитков и печатных книг, которые пострадали вследствие естественного старения, воздействия влажности или пожаров и хранятся в особых условиях.
Объект, который нельзя разворачивать, помещается в томограф. Затем реконструируется цифровая копия документа, над которой и производятся все дальнейшие манипуляции.
Это первая полностью автоматическая система виртуального разворачивания свитков, не требующая вмешательства человека. Проблему анализа старых свитков с привлечением томографии ученые по всему миру пытаются решить более двадцати лет, предлагая разные подходы с машинным обучением. Вопрос полной автоматизации процесса при этом до настоящего времени не был решен. Обычно человеку сначала нужно подобрать параметры, чтобы запустить работу алгоритмов – это требует немало времени и сил.
Разработка создавалась на базе Smart Tomo Engine – программного продукта для томографической реконструкции. Для обучения нейросети использовался специально созданный в Smart Engines корпус данных, включающий шесть образцов свернутых разными способами документов. На них были предварительно нанесены буквы и цифры разного размера и схемы с различными графическими элементами.