В экспертном сообществе можно сегодня встретить как минимум два противоположных взгляда на перспективы использования искусственного интеллекта. Первое, оптимистичное, мнение — у ИИ имеется огромный потенциал использования и соответствующие технологии уже сейчас приносят значительные результаты и еще больше принесут в будущем. Второе, скептическое, мнение — нынешняя популярность ИИ это не более чем хайп и через несколько лет генеративные нейросети займут свое «достойное» место по генерации мусорного контента в промышленных масштабах.
Искусственный интеллект на пике популярности
Искусственный интеллект стал центральной темой благодаря достижениям в машинном обучении и появлению таких инструментов, как ChatGPT, — образовалась уникальная точка в пространстве и времени, в которой начинают переплетаться множество инициатив различных организаций и сфер деятельности, создавая единое тематическое поле. Это, в частности, связано с государственной поддержкой ИИ.
В различных индустриях: здравоохранении, промышленности, дискретном производстве, нефтегазовом секторе и транспорте имеются десятки проектов, направленных на внедрение искусственного интеллекта, — предприятия в этих отраслях стремятся использовать возможности ИИ для решения своих насущных задач. Достигнута критическая масса, когда искусственный интеллект в целом и машинное обучение в частности стали интересны и востребованы всеми, что серьезно влияет на развитие технологий и бизнес-процессов.
«Кремниевая лихорадка» XXI века
Вместе с тем пессимисты отмечают, что общество находится в разгаре очередной «кремниевой лихорадки», напоминающей «золотые лихорадки» XIX века — люди массово отправлялись на поиски золота, активно закупая различные инструменты: сапоги, лопаты, промывочные лотки, оружие и пр. В конечном итоге именно продавцы всего подобного оборудования гарантированно выиграли от лихорадки, а искатели в своем большинстве потерпели сокрушительную неудачу.
Ситуация с искусственным интеллектом напоминает ту же лихорадку. Например, ChatGPT требует огромных инвестиций в вычислительные ресурсы, оборудование и электроэнергию. Ажиотаж вокруг этого чат-бота вызвал рост акций технологических компаний, постоянно привлекающих новые инвестиции, что, в свою очередь, способствует росту акций и финансированию новых стартапов и исследований. Такая активность создает «хайп» вокруг ИИ, что еще больше стимулирует рост рынка. Например, стоимость акций компании Nvidia за один день увеличилась на 250 млрд долл., и недавно ее генеральный директор заявил, что уже через пять лет будет создан сильный искусственный интеллект, способный сдать любой экзамен не хуже человека. Это громкое утверждение имеет вполне конкретную цель — повысить стоимость акций ведущего поставщика оборудования для поддержки алгоритмов машинного обучения — конечно, для индустрии искусственного интеллекта потребуется еще больше чипов.
Где реально выстрелил ИИ?
Если говорить о массовом практическом применении искусственного интеллекта в различных секторах экономики, то его пока не наблюдается. Зато машинное обучение, наряду с другими сложными математическими методами, активно используется. Например, модель расходов и оптимизации операционной деятельности одного из отечественных нефтедобывающих предприятий учитывает более 8 тыс. параметров — на математическом уровне подобные задачи решаются достаточно просто и без методов машинного обучения. Однако даже относительно простая математика на таком объеме показателей становится достаточно медленной, особенно при интеграции с десятками корпоративных систем.
Схожая ситуация наблюдается и с методами машинного обучения, когда возникает задача по неструктурированным данным распознать паттерны поведения выборки и научиться прогнозировать. Статистические и математические методы в этом случае не применимы — как правило, не существует линейных функций и четких корреляционных зависимостей, а область исследования предполагает учет множества параметров.
В промышленности внедрение технологий ИИ также приобретает все больший размах, например при прогнозировании выхода из строя оборудования — оптимизация расходов на газонасосное оборудование может крупной нефтяной компании сэкономить миллиарды рублей в год, а также предотвратит техногенные катастрофы.
Банковский сектор также активно использует методы машинного обучения, например, еще недавно считалось, что скоринг, выполненный человеком, — самый точный, но сейчас, когда решение по заемщику нужно принимать за 10–20 секунд, скоринговые модели, обученные с помощью машинного обучения (например, градиентный бустинг), становятся незаменимыми, став уже фактическим стандартом у ведущих банков.
Технологии машинного обучения нашли широкое применение и в здравоохранении. Например, платформа Luxms BI используется для мониторинга работы больниц и стационаров Москвы — в Департаменте здравоохранения города строятся прогнозные модели по инфекционным заболеваниям и различным нозологиям (причинам и условиям возникновения болезней), а также именно с помощью искусственного интеллекта решаются задачи, связанные с распознаванием болезней по снимкам МРТ. Таким образом, несмотря на скептицизм по поводу искусственного интеллекта, технологии ИИ продуктивно используются.
Нейросети — это всего лишь аппроксимация графиков
Задачи классификации и распознавания объектов действительно хорошо решаются с помощью нейронных сетей. Особенно стоит отметить успехи ChatGPT и мультимодальных нейронных сетей в генерации контента, идентичного натуральному, здесь даже скептики должны согласиться. Однако, как известно, работа нейросети сводится к аппроксимации графиков функций — удивляет, что такой простой математический аппарат, как аппроксимация графиков, удалось применить к решению большого числа проблем, в том числе и к прогнозированию. Тот факт, что стала возможной генерация контента, включая фото и видео, поражает.
Бессилие ИИ
Несмотря на то, что в ряде прогрессивных организаций подразделения, занимающиеся искусственным интеллектом и машинным обучением, уже выделены в отдельные бизнес-единицы и рассматриваются как ключевые структурные элементы — все же это движение не стало массовым. Прогнозирование инфекционных заболеваний, оптимизация логистики, скоринг заемщиков — все эти достижения впечатляют, но напоминают о ситуации, когда 10–15 лет назад в каждой компании был аналитик, который по заказу различных подразделений создавал аналитические записки. Эти действия рассматривались отдельно от основных бизнес-процессов. Например, если возникала необходимость разобраться в эффективности воронки продаж, аналитик начинал работу по запросу, предоставляя информацию руководству. Однако это не означало, что аналитика была полностью интегрирована в операционную или производственную деятельность компании. Массового перехода к более интегрированному подходу пока нет — даже самые современные решения, разработанные с использованием искусственного интеллекта, воспринимаются как отдельные проекты, а их интеграция в повседневные бизнес-процессы оставляет желать лучшего.
Такое положение дел приводит к тому, что пока нельзя говорить о синергетическом эффекте от внедрения ИИ — соответствующие технологии позволяют решать отдельные конкретные задачи, но их влияние на всю цепочку бизнес-процессов не всегда очевидно и измеримо.
Семь недостатков ИИ
На пути к широкому внедрению технологий ИИ имеются серьезные преграды, которые условно можно назвать «грехами» машинного обучения, и их тоже семь.
Плохое качество входных данных
Один из самых значительных барьеров на пути к эффективному использованию машинного обучения — это низкое качество данных, поступающих на вход моделей. Данные часто бывают неполными или ошибочными, что снижает точность, надежность и достоверность предсказаний модели.
Недостаток данных — недообучение
Когда данных для обучения модели недостаточно или их качество оставляет желать лучшего, модель остается недообученной и не способна захватить зависимости в данных, как следствие, плохо справляется с предсказаниями.
Много данных — переобучение
Обратная сторона медали — переобучение, которое происходит, когда модель слишком подстраивается под особенности учебных данных, таким образом снижается точность прогнозов и распознание образов на реальных данных.
Сложный многоэтапный процесс обучения
Обучение моделей машинного обучения — это сложный, многоэтапный процесс, требующий глубоких знаний и опыта в предметной области, весьма похожий на магию, где дата-сайентисты смешивают различные «волшебные» ингредиенты для получения нужного зелья: вынуждены пробовать различные комбинации ПО и бесконечные варианты настроек, чтобы добиться точности работы модели.
Продолжительный процесс обучения
Современные модели машинного обучения требуют значительных вычислительных ресурсов: оборудования, электричества, времени для обучения, что делает процесс крайне ресурсоемким и сдерживает широкое применение машинного обучения.
Потеря точности
После обучения модели на исторических данных, любые изменения на входе могут резко снизить ее точность. Например, модели, обученные до пандемии COVID-19, стали плохо справляться с предсказаниями в изменившихся социальных условиях — потребовалось полное переобучение, что опять-таки дорого и сложно.
Аудит
Основная проблема при использовании машинного обучения — отсутствие четкого объяснения, почему на выходе модели были получены именно такие результаты, особенно при аудите безопасности. Это критично в областях, требующих высокой прозрачности и подотчетности, например, тот же скоринг в банках или сопровождение опасных производственных процессов.
Совместная работа моделей и экспертов
Разберем модель предсказания ишемической болезни сердца. Врачи собирают данные, строят датасеты и приходят к выводу, что модель не работает. Что делать в таких случаях? Формируется экспертная группа из специалистов по ишемической болезни сердца. Эксперты формулируют гипотезы о том, какие факторы в основном влияют на смертность, на восстановление и т. д. Затем, в рамках этих гипотез, тестируются различные субмодели и результаты объединяются. Однако, несмотря на наличие огромного массива данных, собранных за последние десятилетия и детальных записей о пациентах, умерших от ишемической болезни сердца, невозможно корректно обучить модель и точно определить, какой именно фактор был решающим в каждом конкретном случае. Это подчеркивает важность экспертного мнения и глубокого понимания предметной области при работе с машинным обучением.
ИИ не понимает причинно-следственные связи
Невозможно построить полноценные информационные системы на основе машинного обучения без корректного кодирования причинно-следственных связей [1]. Проблема в том, что если одно событие следует за другим, то это не обязательно означает, что первое было причиной второго. Этот базовый принцип логики машинное обучение пока не может адекватно интерпретировать. Это одна из причин, по которой машинное обучение не всегда справляется с задачами, требующими глубокого анализа причинно-следственных связей. Конечно, имеются значительные успехи в генерации видеоконтента и аппроксимации графиков, но задачи поддержки принятия решений остаются без решения. Кроме того, нужно помнить, что «не существует бесплатных обедов» (No Free Lunch) — возможна оптимизация модели для конкретной задачи, но ценой будет потеря точности для других задач (см. таблицу).
Расширение направлений использования моделей
Разберем еще один пример — пользователь системы, основываясь на математической модели, научился прогнозировать выход из строя газонасосного оборудования. Помимо этого, отдельно может существовать модель физического мира внешнего для этого оборудования: температура, вибрация, погода и т. д., непосредственно влияющие на функционирование агрегатов. Работая вместе, модели дадут не просто «красивый» математический прогноз о том, что это устройство с такой-то вероятностью выйдет из строя в течение ближайших трех месяцев, но и представят прогноз в практическом ключе — этот класс оборудования в конкретных условиях эксплуатации (с условным морозом –40 и постоянными перепадами температур) выйдет из строя с вероятностью в 12%.
Моделей для совмещения может быть и больше: логистическая, процессная и пр., что позволит предложить расширенное решение задачи прогнозирования: «Как быстро можно будет доставить вышедшее из строя устройство?», «Как быстро его можно заменить?» и т. п. При этом экспертный ответ, что именно в этом конкретном кусте скважин нужно менять конкретный компрессор, потому что задержка будет дорого стоить, вообще невозможен. Как правило, эксперты — специалисты в определенной области, они могут понять и сделать прогноз, что оборудование выйдет из строя, но вот за то, чтобы это оборудование закупить, отгрузить, поставить и настроить, отвечают уже другие специалисты.
Решение подобных задач в комплексе включает в себя не только предсказание вероятности выхода из строя оборудования в течение определенного времени, но и построение предиктивной модели складского учета и закупки оборудования. Это позволит более эффективно решать актуальную сегодня для многих предприятий задачу обеспечения непрерывности производства.
Что будет с нейросетями через пять лет?
Сейчас искусственный интеллект обучается на данных, созданных человеком, но что если уже через пять лет 99% данных будут генерироваться самим ИИ? В итоге получится, что ИИ будет учиться на собственных данных и ошибках, не приведет ли это вообще к бессмысленности применения ИИ и машинного обучения?
Нейросеть, обучаемая на собственных результатах, рано или поздно схлопнется, перестанет выдавать даже относительно приемлемый контент, который с каждым разом будет становиться все более однородным. И это также отсылает нас к первому недостатку машинного обучения — качеству входных данных.
Нужно ясно понимать: когда искусственный интеллект генерирует контент, он не создает ничего нового — не будет новой поэмы Пушкина или новых философских концепций Канта или Аристотеля. Максимум, что сейчас можно получить, — это «салат» из всех поэм Пушкина, сделанный по типовому рецепту.
Рано или поздно «змея когда-нибудь укусит себя за хвост» — нейросеть не сможет продолжать генерировать достойный контент.
***
Обсуждая перспективы использования искусственного интеллекта, важно соблюдать баланс между оптимизмом и реализмом. Хотя ИИ обладает определенным потенциалом и уже демонстрирует определенные успехи в различных областях, необходимо признать наличие множества нерешенных проблем.
Литература
1. Борис Славин. Перспективы создания сильного искусственного интеллекта // Открытые системы.СУБД. — 2024. — № 1. — С. 13–17. URL: https://www.osp.ru/os/2024/01/13058216 (дата обращения: 21.06.2024).
Дмитрий Дорофеев (dima@luxmsbi.com) — главный конструктор, Александр Тютюнник (altutunnik@luxms.com) — директор по развитию бизнеса ГК Luxms (Санкт-Петербург). Статья подготовлена на основе материалов выступления на форуме «DATA&AI 2024».