Первыми искусственный интеллект для улучшения профилактики сердечно-сосудистых заболеваний внедрили на Ямале

Подсказки, которые спасают здоровье
31.08.2020

В Карелии собирают банк биомедицинских данных и создают цифрового помощника врача с искусственным интеллектом, способного предсказывать будущее.

Наблюдая за работой врача на приеме, невольно задаешься вопросом: неужели можно правильно оценить состояние пациента всего за несколько минут? Опытный врач обычно справляется: опрос, беглый взгляд на результаты последних анализов и исследований, осмотр — и назначение лечения. Рутина. Но может ли врач сказать, что будет со здоровьем этого человека через год-другой? Потребность в такого рода прогнозе чрезвычайно велика: профилактика тяжелых заболеваний, обнаружение самых первых «тревожных звоночков» — слабое место современного здравоохранения, и пандемия COVID-19 это в очередной раз подтвердила. Не случайно прогнозная аналитика, управление популяционными рисками и поддержка принятия клинических решений входят сегодня в топ самых «горячих» направлений на рынке медицинских ИТ.

Однако для адекватных прогнозов врачам нужно на порядки больше данных и… времени на их изучение. И тут на сцену выходит его величество искусственный интеллект. «Процесс анализа электронной медицинской карты может занимать до 10–15 минут и более, что совершенно неприемлемо в реальной клинической практике, — свидетельствует врач-кардиолог Денис Гаврилов. — Внедрение технологий искусственного интеллекта во врачебную практику позволяет сократить время на обработку медицинских данных пациента для оценки и выявления факторов риска и подозрений на заболевания в начальной стадии. В этом случае нагрузка по анализу данных переносится с врача на информационную систему».

Денис Гаврилов

Денис Гаврилов: «Внедрение искусственного интеллекта во врачебную практику позволяет сократить время на обработку медицинских данных пациента для оценки и выявления факторов риска и подозрений на заболевания в начальной стадии»

Искусственный интеллект подобен системе сигнализации, которая при необходимости включает тревогу: «Не пропустите!». Сегодня уже в двух российских регионах «присутствие» «умного» помощника на приеме врача тоже становится в хорошем смысле рутиной. Звучит фантастически. О том, как искусственный интеллект «сказку делает былью», рассказывает Александр Гусев, директор по развитию компании «К-Скай». Компания из Карелии, созданная Александром вместе с Романом Новицким, специализируется на разработке моделей, предсказывающих развитие заболеваний с помощью машинного обучения. Система Webiomed уже работает в 12 больницах в Кировской области и в 10 в Ямало-Ненецком автономном округе.

Александр Гусев: «Всего три года назад я относился к искусственному интеллекту как к научной фантастике»

Александр Гусев

Александр Гусев: «Data scientist может быть более эффективным, чем врач на приеме и спасти больше жизней. И это не сказка»

- С чего все началось? Как родилась идея сделать «медицинский интеллект»?

Честно говоря, всего три года назад я относился к искусственному интеллекту как к научной фантастике. Но когда на западе начался бум ИИ-стартапов для здравоохранении, коллега посоветовал обратить внимание на это как на возможное направление для будущего роста. Тема медицинского искусственного интеллекта зацепила. Это оказалось очень интересно: здесь был не только бизнес, и не только технологии — встречались реальные случаи, когда искусственный интеллект спасал жизни, находя, например, пропущенную онкологию, благодаря чему пациента начинали лечить раньше.

 - Какие важнейшие реперные точки вы прошли с тех пор?

Первая такая точка — создание в 2018 году Ассоциации разработчиков и пользователей искусственного интеллекта в медицине (Национальная база медицинских знаний). Уже осенью того же года нам удалось договориться с руководителями Ямала о проведении пилотного проекта и испытать первые наработки. Нынешней весной мы завершили клинические испытания системы и закончили процесс госрегистрации. Это настоящий прорыв, до сих пор ни одна система поддержки принятия решений врача в России не имеет такой регистрации.

Наконец, этим летом мы привлекли венчурные инвестиции. Добиться доверия частных инвесторов, чтобы они вложили в компанию личные деньги, — это выход на совершенно другую орбиту.

- Как планируете развивать проект?

Система Webiomed стала первой российской разработкой в области искусственного интеллекта для здравоохранения, зарегистрированной как медицинское изделие. До этого никто не верил в то, что это вообще возможно.

С нашим искусственным интеллектом работают врачи Кировской области и Ямала, развивается проект в Карелии. Хотим запустить еще несколько региональных проектов в России и попробовать выйти на международный рынок.

- Какие люди вам нужны для развития проекта?

У нас открыты вакансии специалистов по работе с данными, аналитиков, программистов. Мы очень быстро растем, людей не хватает катастрофически. Нам нужны таланты!

Data Science — это пока скорее искусство, чем мастерство. Здесь многое зависит от интуиции и везения. Методов и пакетов множество, и они очень по-разному работают на разных данных и в разных задачах. Много месяцев уходит на эксперименты. Например, глубинное обучение где-то дает великолепный результат, а где-то — на порядок хуже, чем байесовский метод или деревья решений. Обучили машину, сделали алгоритм, а он часто ошибается. Но в медицине ошибки слишком дороги. Мы ищем ребят, которые возьмут нашу задачу и сделают такой точный алгоритм, который все затмит.

- Есть ли у вас требования к образованию, уровню знаний и навыков?

К набору в команду мы подходим неформально, берем даже без профессионального образования. Нам важнее горящие глаза и желание развивать вместе с нами наш проект. Эффективность оцениваем не в первую очередь. Хотя амбиции людей часто опережают их реальный потенциал.

Неудачи в нашей работе случаются на порядок чаще, чем удачи. Человек, который «горит», переживет неудачу и будет дальше пытаться искать решение, а тот, кто относится к работе формально, не поможет нам достичь задуманного. У нас есть несколько студентов-старшекурсников и ребят, только что закончивших университеты, и они реально «зажигают».

- Как вы их находите?

Часто случайно. Очень помогли публикации в СМИ — после них к нам стали обращаться, в том числе из социальных сетей.

Спасительный искусственный интеллект

Когда data scientist получает банк данных с миллиардами записей о миллионе пациентов и находит неизвестное медицинской науке знание, а программный продукт интегрирует это знание в рабочее место врача и обращает его внимание на конкретное заболевание на самой-самой ранней стадии, появляется возможность спасти здоровье и жизнь гораздо большего числа людей.

«Медицинский интеллект может быть более эффективным, чем врач на приеме, и спасти больше жизней. И это не сказка, — убежден Гусев. — Человек может еще ни на что не жаловаться, а искусственный интелект уже понимает, чем, скорее всего, дело кончится. И это можно научно обосновать».

Испытания на практике показывают, что система относит к группе высокого риска в несколько раз больше пациентов, чем врачи во время диспансеризации, замечает больше факторов риска, учитывает пропущенные данные. И все это — без дополнительных затратных обследований, что немаловажно для рационального расходования бюджетов.

Желают знать, что будет

В первую очередь систему Webiomed научили работать с сердечно-сосудистыми заболеваниями — предсказывать инфаркты, инсульты, развитие гипертонии и смерть от них. Во-первых, потому что это главная беда по частоте заболеваемости и вероятности гибели людей, а во-вторых, потому что медицинские консультанты в команде — кардиологи.

Две модели на нейронных сетях, работающие как «черные ящики», делают вывод о том, что будет с пациентом. Большинство существующих цифровых сервисов в основном анализируют изображения или результаты анализов и сообщают, что не так с пациентом в настоящий момент. Разработчики Webiomed идут дальше — пытаются спрогнозировать, что будет и предупредить пациента: через три года может случиться инфаркт или инсульт. Чтобы человек задумался, начал вести здоровый образ жизни и соблюдать рекомендации врачей сейчас, а не когда уже будет поздно.

В настоящее время разрабатываются средства прогнозирования госпитализации кардиопациентов в течение ближайших 12 месяцев. Затем планируется добавить возможности для прогнозирования сахарного диабета, инфекционных и других заболеваний.

Производственная база — копилка данных

Что каждый день делает команда, кроме разработки продукта? Собирает медицинские данные! «Мы встречаемся с руководителями клиник, главами регионов, разработчиками медицинских систем и договариваемся о получении обезличенных данных», — рассказал Гусев. Таким образом накапливается большая база — банк биомедицинских данных, хранящихся в федеральном ЦОДе, в облаке Mail.ru. Сейчас в банке находится около 50 млн документов — информация о примерно 1,2 млн пациентов.

Средний возраст источников данных — около 7 лет. Самым богатым данными медкартам более 20 лет — одна карельская клиника ведет полностью электронную историю болезни с 1998 года. Самым молодым источникам лишь два-три года, но и в них есть, что анализировать.

На основе накопленных специалисты в области data science создают модели методами машинного обучения и ищут зависимости. «Их роль в успехе ключевая: если они не научатся качественно извлекать знания, продукта просто не будет. Data science — это наша курица, несущая золотые яйца, и одновременно ахиллесова пята», — признается Гусев.

Серая зона, шлак и деградация точности

Главное препятствие, о которое регулярно спотыкается ИТ-бизнес в медицине, — «серые» зоны нормативного регулирования. По закону данные принадлежат пациенту, и нужна грамотная поддержка юристов, чтобы компанию не обвинили в незаконном сборе информации. Но это скучная область. Гораздо интереснее сложности другого порядка.

Собранные из медкарт обезличенные документы — это сырые данные. Набор данных, на котором получается создать модель, должен содержать минимум несколько тысяч записей. При этом соотношение шлака и полезных сведений безумное: надо перекопать 100 тыс. тонн «грунта», чтобы найти малюсенький «самородок». Из миллиона карт пациентов получается датасет всего из 200–300 записей, где есть минимально необходимые данные (возраст, рост, вес, артериальное давление, анализ крови и т. д.). Иногда пациента наблюдают давно, но при этом ни разу не проверяли его уровень холестерина, не делали УЗИ, данные которого содержат много ценной информации для предсказания заболеваний.

Насколько достверный прогноз делает искусственный интеллект? Точность моделей — это «математическая уверенность» в том, что данные интерпретируются правильно. Сейчас точность Webiomed составляет 78–79%, что подтверждено и пилотными проектами, и клиническими испытаниями. Это не рекорд, в мире есть конкуренты, которые прогнозируют развитие некоторых заболеваний с точностью 85–90%. «Для меня это что-то небывалое, потому что иногда большую роль играет фактор случайности, — поясняет Гусев. — Например, причиной тромбоэмболии может стать резкое движение, и предсказать это просто невозможно».

Для повышения точности есть только один путь — набирать как можно больше данных и учитывать больше признаков по каждому пациенту. В команде Гусева машинное обучение начинали с датасета в 500 пациентов и 10 признаков, сейчас — уже 5 тыс. пациентов и почти 20 признаков, следующий уровень — 50 тыс. пациентов и свыше 100 признаков.

Пока своих данных недостаточно, систему обучают на готовых зарубежных датасетах. Например, для обучения прогнозированию сахарного диабета пришлось использовать известный эндокринологам американский датасет. Но когда модель обучают на данных другой популяции, а потом проверяют на практике в России, ее точность порой получается недостаточной. В России и Европе риск смерти от сердечно-сосудистых заболеваний чаще всего оценивают по шкале SCORE (Systematic Coronary Risk Estimation), например при диспансеризации. Однако, когда шкалу SCORE проверяли в реальной клинической практике в других странах, ее «точность» оказывалась всего 30% — точнее будет подкинуть монетку.

Но выход есть: надо разрабатывать собственные модели, которые учитывают эндемичность российского пациента. А для этого нужно копить данные и производить свои датасеты. Это долгая и сложная работа исследователей данных. Именно этим сейчас и занимаются Гусев и его команда.

«Чтобы нам доверяли, нужно чтобы наши прогнозы были максимально точными, — поясняет он. — Но, добавляя новые факторы риска, мы повышаем точность лишь на доли процента, а чтобы повысить ее на 5%, понадобится два–три года работы — по каждой болезни».

Сейчас в команде занимаются прогнозированием сахарного диабета, легочных и инфекционных заболеваний, а также патологических состояний беременных. Уже к концу 2020 года вместо одного медицинского направления будет пять.

Научиться читать как врач

Многие данные хранятся в виде сделанных врачом текстовых записей. Но, накопив миллионы документов, нужно научиться анализировать не тексты, а факты. Например, курил пациент или нет. Курение — серьезный фактор риска сердечно-сосудистых заболеваний: инфаркты-инсульты у курильщиков случаются гораздо чаще. А как из текста вытащить факт? Извлечение достоверных данных из врачебных записей — непростая история, ведь эти записи — отдельный эпистолярный жанр. Врач может написать: «пациент бросил курить вчера», «не курит», «никогда не курил», «отрицает курение как факт». А машина видит слово «курит» и думает, что пациент курит. Над тем, чтобы научить ее понимать нюансы и передавать смысл, работают целые компании, специализирующиеся на обработке текстов на естественном языке (Natural Language Processing, NLP). А для прогнозирования болезни надо извлекать не один признак, а множество. Для английского языка есть надежные модели извлечения знаний из неструктурированных медицинских текстов, появляются также работы в Китае, но российских специализированных ресурсов именно для медицины крайне мало.

О сколько нам открытий…

Американские и китайские ученые, работающие над предсказанием инфарктов и инсультов, недавно опубликовали любопытный результат своего исследования. Они собрали для анализа не только медицинские документы, но и данные о погоде, месте жительства пациента и его работе — так называемые социальные детерминанты. Учет социальных детерминантов — хайповая тема в медицинских data science!

Оказалось, один из самых надежных предикторов инфаркта или инсульта — расстояние от места жительства пациента до супермаркета. Поначалу медики посмеялись над этим открытием. Но статистически это абсолютно точно доказано. Стали разбираться, почему так. Оказалось, что, когда у человека под боком магазин с дешевым фастфудом, он чаще покупает нездоровую, жирную еду. На фоне такого питания развивается атеросклероз и нарастают смертельные риски. Чем дальше супермаркет, тем меньше соблазнов и здоровее человек. : -)

Как это работает?

Врач не взаимодействует с искусственным интеллектом напрямую, он принимает пациента и ведет записи в электронной медицинской карте. Медицинская информационная система, подключенная к федеральному облаку, автоматически отправляет в него данные в фоновом режиме и получает обратно результат их интеллектуальной обработки. Если искусственный интеллект обнаруживает тревожные тенденции, на экран выводится всплывающая подсказка: список заболеваний c оценками риска, где заболевания с высоким риском выделены красным цветом. Цифровой помощник подает сигнал врачу: смотри, тут скоро будет инфаркт!

искусственный интеллект

Если искусственный интеллект обнаруживает тревожные тенденции, на экран выводится всплывающая подсказка: список заболеваний c оценками риска.
Фото: «К-Скай»

«Мы еще не готовы сообщать вероятность и дату инфаркта для конкретного пациента, но со временем к этому придем, — уверен Гусев. — Сейчас говорим только о группах риска: из 100 пациентов данной группы 20 получат такое заболевание. Пока врачи будут привыкать к искусственному интеллекту, будем потихоньку конкретизировать прогнозы. Не просто 'обратите внимание, высока вероятность инфаркта', а 'с вероятностью 90% через год будет инфаркт'».

Границы чуда

Назначая лечение или наблюдая пациента, врач может принять подсказку искусственного интеллекта во внимание… или не принять. «Мы надеемся, что он учтет нашу подсказку, но пока не контролируем реакцию врача», — говорит Гусев. В одной клинике попробовали «вмешиваться» в решение врача, не давая подписать документ, если в нем неправильно определены диагноз или группа здоровья (то есть искусственный интеллект относит пациента к группе высокого риска, а врач утверждает, что пациент здоров). В результате получили резко негативную реакцию медиков с перспективой отказа от использования системы.

А ведь искусственный интеллект совершенно не покушается на профессиональную репутацию докторов, которые сосредоточены на «тушении пожара» — работе с жалобами пациентов — и поэтому часто недооценивают риски, упускают из виду существенные факторы и пропускают медкарты при стратификации рисков.

Это этическая и психологическая проблема: как только мнение врачей подвергается сомнению, они отторгают источник этого сомнения, даже если оно правомерно. Поэтому разработчики пока просто фиксируют факт того, что искусственный интеллект разошелся во мнениях с врачом, и могут предоставить эту информацию руководителям в виде аналитического отчета.

Чтобы точно выяснить, удалось ли c помощью искусственного интеллекта снизить смертность, потребуется несколько лет наблюдений. Пока таких данных нет, но компания уже готовится провести исследование: двойное слепое рандомизированное — как в фарминдустрии. «Мы ищем федеральный научный центр, который поможет его организовать, у нас самих не хватит компетенций в клинических исследованиях», — сообщил Гусев.

Больше информации об интересных событиях, тенденциях и фактах в сфере цифровой экономики, мнений экспертов, а главное — ярких рассказов о решениях на основе данных в социальной сфере, здравоохранении, культуре, образовании, благотворительной и волонтерской деятельности, читайте в новом проекте «DobroData. Данные на службе добра». Пусть тех, кто умеет делать мир лучше, станет больше! Возрастная маркировка: 12+