В условиях перехода к цифровой экономике данные станут ключевым фактором во всех сферах деятельности, оказывающим влияние на конкурентоспособность страны, качество жизни граждан, экономический рост и национальный суверенитет [1]. Поэтому основное внимание будет уделяться технологиям сбора, обработки и хранения разнородных данных, значимых в различных отраслях экономики, сфере обороны и безопасности. Именно на решение этих задач направлены так называемые сквозные цифровые технологии: большие данные; нейротехнологии и искусственный интеллект; системы распределенного реестра; квантовые технологии; новые производственные технологии; Промышленный интернет; компоненты робототехники и сенсорика; технологии беспроводной связи; технологии виртуальной и дополненной реальности.
Стремительно растет объем обрабатываемых данных, получаемых из таких основных источников, как средства телеметрии промышленного оборудования, средства неразрушающего контроля, включая медицинскую диагностическую аппаратуру и досмотровую технику, научное измерительное оборудование, аэрокосмические системы дистанционного зондирования Земли, стационарные видеокамеры, установленные на улице и в помещениях, мультимедийный трафик, циркулирующий в информационно-телекоммуникационных сетях, и т. п. По некоторым оценкам, весь объем знаний, накопленный человечеством к 2015 году, составил 4,4 зеттабайт (4,4×1021 байт), а интенсивность потока, ежемесячно формируемого различными сенсорами, в 2017 году составила около 11 экзабайт (11×1018 байт) с тенденцией сохранения экспоненциального роста в обозримом будущем.
Развитие инфраструктуры получения данных происходит под действием целого ряда факторов.
Рост возможностей сенсоров: увеличение быстродействия (чувствительности), разрешающей способности и динамического диапазона (радиометрической точности). Объемы данных, генерируемых одним сенсором в единицу времени, увеличиваются, что во многом связано с сокращением топологических норм проектирования, используемых для создания сенсоров микроэлектронных компонентов (в частности, видеопоток от одной камеры наружного наблюдения составляет в сутки около 25 Гбайт, БПЛА за 15 минут полета формирует около 6 Гбайт данных, а обычный объем телеметрии от метеорологической станции превышает 100 Гбайт в сутки).
Увеличение количества сенсоров, генерирующих потоки данных различных форматов (акустика, спектрометрия, семантика, телеметрия и пр.), которые могут быть использованы для мониторинга значимых объектов и окружающей среды. Этот рост обусловлен появлением сенсоров, работающих на новых физических принципах, уменьшением их стоимости, улучшением технических характеристик и повышением надежности.
Развитие сетевых технологий, обеспечивающих надежную передачу потоков данных от сенсоров к средствам обработки и хранения информации. Одним из следствий действия данного фактора стало появление Интернета вещей. Объемы информации, передаваемой между техническими устройствами, многократно превышают объемы информации, формируемой и потребляемой людьми. Так, в Российской Федерации количество устройств, подключенных к Интернету, в период с 2010 по 2015 год выросло втрое и достигло 331 млн шт. При этом общий объем трафика вырос в 5,5 раза и составил 880 Пбайт в месяц.
Значительная часть задач обработки поступающих данных — это так называемые интеллектуальные задачи, которые во многих случаях успешно решаются человеком с использованием естественного интеллекта, позволяющего, в частности:
- уверенно отделять объекты от фона, отличать существенные признаки от вторичных, ориентируясь при этом на специфику решаемой прикладной задачи;
- при решении задач с высокой вариабельностью условий задействовать интуицию, сокращая объемы простого перебора вариантов, используя неявные ориентиры, хранящиеся на периферии сознания;
- при обработке информации о конкретном объекте учитывать окружающий контекст и знания о его физической природе;
- воспринимать индивидуальное как типичное, определяя отношение конкретного объекта или ситуации к некоторой парадигме, производя осмысленное разбиение объектов и ситуаций на группы;
- оперировать с неоднозначностями.
Интеллектуальные способности человека формировались эволюционно и обеспечивают беспрецедентно высокое качество обработки информации, воспринимаемой его органами чувств. Соответственно, интеллектуальные задачи также преимущественно связаны с обработкой информации антропоморфной модальности. Кроме того, интеллектуальные способности человека непосредственно связаны с необходимостью управлять его телом и имеют, таким образом, ярко выраженную «соматотопическую» природу. Наконец, принимая во внимание социальную природу человека, можно сказать, что естественный интеллект во многом сформировался для обеспечения успешного пребывания в обществе. Таким образом, к основным группам решаемых человеком интеллектуальных задач могут быть отнесены:
- распознавание образов (выделение объектов на сложных фонах, устранение неопределенности ракурса и полиморфизма объектов, распознавание графических образов);
- извлечение, формирование и накопление знаний (автоматическое формирование онтологических описаний, категоризация объектов и процессов, выявление латентных зависимостей в разнородных данных, аннотирование и семантическое индексирование текстов, перевод текстов с одного языка на другой);
- социальное коммуницирование (распознавание человеческой речи, идентификация человека по лицу в сложных условиях и с учетом возрастной изменчивости, идентификация человека по походке и жестам, оценка намерений и прогнозирование поведения человека);
- позиционирование в пространстве (определение собственных координат и положения в пространстве методами ландшафтной, интерьерной навигации);
- манипулирование физическими полиморфными объектами в условиях изменчивости среды (локализация и определение положения объектов, управление антропоморфными манипуляторами);
- принятие решений в непредвиденных ситуациях с учетом ценностных аспектов (прогнозирование последствий принятия альтернативных решений, выбор рациональных вариантов с учетом субъективных ценностей, приближенное решение сложных задач, требующих перебора большого числа вариантов).
В контексте построения цифровой экономики интерес для автоматизации представляют «прикладные» интеллектуальные задачи, связанные с выполнением рутинных действий. Автоматизированное решение таких задач возможно благодаря технологиям прикладного искусственного интеллекта, призванным заменить человека — носителя естественного интеллекта. По мнению аналитиков [2], к 2030 году около 800 млн людей во всем мире могут лишиться своей текущей работы из-за автоматизации, а согласно исследованиям McKinsey Global Institute, в Российской Федерации может быть автоматизирована работа более 35 млн человек — половины трудоспособного населения страны [3].
Ключевой вопрос замены человека технической системой — обеспечение доверия к результатам работы систем прикладного искусственного интеллекта. Здесь можно рассматривать как минимум два подхода: обеспечение доверия к процессу обработки информации и обеспечение доверия к результату. Первый подход основывается на интерпретируемости, обеспечении «прозрачности» алгоритмов обработки данных, что в случае интеллектуальных информационных систем не всегда оказывается возможным именно в силу специфики решаемых задач. В качестве примера можно привести обученную многослойную искусственную нейронную сеть, структура которой не всегда поддается интерпретации, достаточной для понимания человеком алгоритма, реализуемого этой сетью. Более того, можно предположить, что в тот момент, когда алгоритм решения задачи все-таки удается изложить в понятном для человека виде с хорошо интерпретируемой и «прозрачной» последовательностью действий, эта задача перестает быть интеллектуальной и переходит в категорию обычных вычислительных задач. Для того чтобы отличить истинностные (неинтеллектуальные) решения от интеллектуальных, обычно используют следующее правило: первые имеют дело с нахождением логичных, объективно истинных решений, а вторые — с выбором субъективно «хороших» решений. Таким образом, единственно возможным может оказаться обеспечение доверия к результату работы интеллектуальной системы.
Процедура подтверждения качества результата работы интеллектуальной системы включает ряд последовательных этапов.
- Оценка возможностей квалифицированного человека-оператора при решении прикладной задачи.
- Оценка возможностей интеллектуальной технологии при решении задачи.
- Сопоставление возможностей человека и технологии для определения значений показателей качества технологии. Здесь под качеством, согласно требованиям стандартов ISO 9000, понимается степень соответствия характеристик объекта (в данном случае — интеллектуальной технологии) предъявляемым требованиям.
- Сравнение значений показателей качества с установленным критериальным порогом и принятие решения о соответствии или несоответствии технологии предъявляемым требованиям.
Важно отметить, что выполнение этапов 1 и 2 осуществляется на единой (унифицированной) тестовой выборке исходных данных, сложность которой должна соответствовать условиям решаемой прикладной задачи обработки информации, а объем и вариативность должны быть достаточными для того, чтобы совпадение возможностей человека и технологии на этой контрольной выборке гарантировало то, что и в дальнейшем, при практическом использовании технологии ее возможности с определенной заданной вероятностью не будут уступать возможностям квалифицированного человека-оператора.
Чтобы получить достоверные оценки возможностей интеллектуальных способностей человека при решении прикладных задач, целесообразно в качестве экспертов привлекать группу квалифицированных операторов. Минимально достаточные размеры этой группы могут быть определены с использованием коэффициента конкордации Кендалла, характеризующего степень согласованности решений, получаемых экспертами при обработке контрольной выборки исходных данных [4].
Для оценки возможностей как человека-оператора, так и технологии используются функциональные характеристики, определяемые типом решаемой интеллектуальной задачи. В частности, для задач распознавания функциональные возможности характеризуются частотой ошибок первого (ложное срабатывание, False Positive) и второго (пропуск события, False Negative) рода, связанными с ними показателями точности P (precision), полноты R (recall) и избирательности S (specificity) распознавания, а также их сверткой.
Так или иначе, процедура подтверждения соответствия должна быть регламентирована соответствующими документами по стандартизации, устанавливающими требования к средствам интеллектуальной обработки информации. Специфика таких стандартов заключается в следующем:
Стандарты должны включать статистически значимую выборку исходных данных, на которых необходимо производить оценку соответствия. Объем и вариативность этой тестовой выборки должны соответствовать условиям решаемой интеллектуальной задачи обработки информации.
Стандарты должны содержать критериальные значения, характеризующие возможности квалифицированного человека-оператора по решению конкретных интеллектуальных задач на тестовой выборке. Критериальные значения определяются экспериментально с привлечением операторов, практический опыт которых позволяет использовать их способности в качестве референтных.
В некоторых случаях (например, для задач поэкземплярного распознавания) стандарты должны содержать также требования, ограничивающие размеры и информативность обучающей выборки исходных данных, необходимых для эффективной работы средств решения интеллектуальных задач.
На сегодняшний день разработка таких стандартов еще находится в начальной стадии, а из-за их отсутствия сдерживается полноценное внедрение технологий искусственного интеллекта. Первое заседание подкомитета SC42 «Искусственный интеллект», созданного в начале 2018 года в рамках комитета ISO/IEC 1 «Информационные технологии», состоялось в апреле 2018 года. На нем были сформированы рабочая группа по базовым стандартам искусственного интеллекта (WG1, Foundational standards) и три исследовательские группы: «Вычислительные методы и характеристики систем ИИ» (SG1, Computational approaches and characteristics of artificial intelligence systems), «Безопасность ИИ» (SG2, Trustworthiness) и «Приложения ИИ» (SG3, Use cases and applications).
Системы искусственного интеллекта находят применение в самых разных отраслях, и в каждой прикладной области отмечаются специфические задачи, предполагающие формирование и нормативное закрепление специальных тестовых выборок, измерение функциональных возможностей квалифицированных операторов, определение показателей и критериев качества прикладных интеллектуальных технологий [5]. Подготовка полноценных документов по стандартизации невозможна без активного участия заинтересованных отраслевых потребителей интеллектуальных технологий. Поэтому вопросы стандартизации в области систем искусственного интеллекта должны рассматриваться в рамках профильных технических комитетов по стандартизации с учетом отраслевой специфики интеллектуальных задач.
В Российской Федерации работы по подготовке нормативно-технических документов, устанавливающих требования в области технологий искусственного интеллекта, применяемых в промышленности, включая оборонную промышленность, в образцах вооружения и военной техники, в системах безопасности, целесообразно осуществлять в рамках технических комитетов ТК22 «Информационные технологии», ТК098 «Биометрия и биомониторинг» и ТК234 «Системы тревожной сигнализации и противокриминальной защиты». Профильным техническим комитетом по стандартизации технологий искусственного интеллекта для «гражданских» отраслей экономики, включая перспективные рынки, формируемые в рамках программы «Цифровая экономика Российской Федерации» и Национальной технологической инициативы, представляется ТК194 «Киберфизические системы». В то же время особенности применения интеллектуальных технологий при решении задач здравоохранения могут быть в полной мере учтены в рамках ТК468 «Информатизация здоровья» (подкомитет ПК3 «Семантический контент в медицинских информационных, аналитических, интеллектуальных, робототехнических и телемедицинских системах, применение ресурсов сети Интернет в здравоохранении»).
Применение документов по стандартизации для оценки соответствия разрабатываемых интеллектуальных технологий предъявляемым требованиям должно осуществляться силами отраслевых органов по сертификации и испытательных лабораторий.
***
Подготовка полноценных документов по стандартизации в сфере интеллектуальных технологий невозможна без активного участия заинтересованных отраслевых потребителей — вопросы стандартизации должны рассматриваться в рамках профильных технических комитетов с учетом отраслевой специфики интеллектуальных задач. Создание системы оценки соответствия технологий искусственного интеллекта будет способствовать развитию этого важного направления путем гарантирования возможностей технологий при решении конкретных прикладных задач искусственного интеллекта; обеспечения возможности сравнения технологий прикладного искусственного интеллекта с возможностями человека-оператора, а также объективного сравнения таких различных технологий друг с другом.
Литература
- Программа «Цифровая экономика Российской Федерации». Утверждена Распоряжением Правительства Российской Федерации № 1632-р от 28 июля 2017 г.
- L.Nedelkoska, G.Quintini. Automation, skills use and training // OECD Social, Employment and Migration. Working Papers. — 2018. — N. 202 (March). — 125 p.
- A Future that Works: Automation, Employment, and Productivity. McKinsey Global Institute.— 2017 (January). — 148 p.
- Гарбук С.В., Бакеев Р.Н. Конкурентная оценка качества технологий интеллектуальной обработки данных // Проблемы управления. — 2017. — № 6. — С. 50–62.
- Гарбук С.В. Об оценке соответствия в области технологий искусственного интеллекта. Сборник трудов VIII Международной конференции «ИТ-Стандарт 2017». — М.: Проспект, 2017. — С. 21–32.
Сергей Гарбук (Garbuk@fpi.gov.ru) — заместитель генерального директора, Фонд перспективных исследований (Москва).