Алгоритм построит живую клетку
02.11.2020

Машинное обучение ускоряет работы в области синтетической биологии. Искусственный интеллект приходит на помощь новому поколению исследователей, высвобождая их время для более творческих процессов научного поиска.

Если вы пробовали вегетарианские гамбургеры, напоминающие по вкусу мясо, или использовали косметику с синтетическим коллагеном, можно считать, что в определенном смысле вы уже знакомы с синтетической биологией. Ее влияние ощущается сегодня практически во всех секторах: продовольствие, медицина, сельское хозяйство, климат, энергетика и материалы. Специалисты в области синтетической биологии задают спецификации никогда не существовавших в природе биологических систем, например, проектируя микробов, которые будут бороться с раком, а потом «собирают» их в соответствии с этими спецификациями. Однако традиционные методы биоинженерии медленны и трудоемки, поскольку основным подходом к выбору нужных «строительных материалов» здесь является метод проб и ошибок.

На помощь пришли технологии машинного обучения, адаптированные к потребностям синтетической биологии. Теперь исследователям не придется тратить годы на тщательный анализ того, за что отвечает каждая клетка. Как выяснилось, при наличии даже ограниченного набора обучающих данных предложенные алгоритмы смогут предсказать, как повлияют на поведение клетки изменения в ДНК или биохимии, и выдадут рекомендации для следующего инженерного цикла, оценив вероятность достижения желаемой цели.

Возможности открываются поистине революционные. К примеру, на создание антималярийного препарата артемизина ушло 150 человеко-лет, а новые технологии обещают создание новых клеток за считанные недели.

Группа исследователей из Национальной лаборатории Лоуренса в Беркли (США) разработала алгоритм, получивший название Automated Recommendation Tool. Этот инструмент учитывает особенности синтетической биологии: небольшие наборы обучающих данных, а также необходимость количественной оценки неопределенности и рекурсивных циклов.

Алгоритм использовался для управления процессом метаболической инженерии и увеличения производства триптофана – аминокислоты широкого спектра применения. Для проведения экспериментов были выбраны пять генов, которые представляют в общей сложности почти 8 тыс. возможных комбинаций биологических путей. Затем исследователи получили экспериментальные данные по 250 из этих путей, то есть всего по 3% всех возможных комбинаций. Эти данные использовались для обучения алгоритма.

Рекомендованный алгоритмом вариант позволил увеличить производство триптофана – вдвое по сравнению с современным эталонным штаммом и, что интересно, по сравнению с лучшими вариантами, используемыми для обучения модели.

Таким образом, было продемонстрировано, что технологии искусственного интеллекта могут эффективно выполнять рутинные части исследований в области синтетической биологии, высвобождая время ученых для более творческих процессов научного поиска.

Больше информации об интересных событиях, тенденциях и фактах в сфере цифровой экономики, мнений экспертов, а главное — ярких рассказов о решениях на основе данных в социальной сфере, здравоохранении, культуре, образовании, благотворительной и волонтерской деятельности, читайте в новом проекте «DobroData. Данные на службе добра». Пусть тех, кто умеет делать мир лучше, станет больше! Возрастная маркировка: 12+