Представьте себе — не только люди, но и роботы учатся, наблюдая за тем, как те или иные действия выполняют их опытные наставники. Более того, они порой оказываются более внимательными и успешными — хотя и не такими инициативными и любознательными — учениками. Известно немало примеров того, что «профессиями», в которых важнее точность выполнения схожих повторяющихся операций, а не творческий подход и самостоятельность в решении новых и неожиданных задач, роботы овладевают лучше людей. Так, достаточно просто показать им, как выполнять рутинную работу по дому или накрывать на обеденный стол — и они уже готовы помогать вам. Но тот факт, что на дороге самоуправляемый автомобиль научился безопасно ездить, понаблюдав за приемами вождениями опытного водителя-человека, не может не удивлять.
Так или иначе, исследователи одного из американских университетов разработали систему, которая помогает роботам изучать сложные задачи путем просмотра небольшого числа демонстраций, пусть даже не слишком совершенных. Система работает, оценивая качество каждой демонстрации, и учится на тех ошибках и успехах, которые наблюдает. Если до сих пор созданные методы требуют для решения той или иной задачи не менее ста демонстраций, то здесь их число оказывается гораздо меньше. Демонстрации оцениваются и ранжируются на основе сигнальной темпоральной логики. В определенном смысле система сама выносит заключение о точности и успешности демонстрации. Логические рассуждения помогают понять, какие части демонстрации хороши, а какие нет. В сущности, именно так мыслят люди. Если, к примеру, во время демонстрации водитель пропустил знак «Стоп», система выставит ему низкую оценку. Если же он делает что-то разумное, например, нажимает на тормоза, чтобы избежать столкновения, робот будет учиться на этом логичном действии.
Пока систему протестировали только с использованием игрового симулятора и в среде, построенной в рамках платформы Minecraft. Испытания оказались успешными, что позволило разработчикам заявить, что их система может учиться и на симуляторах вождения, а со временем и на реальном видео. В дальнейшем они собираются проверить свою разработку в реальной обстановке и в конце концов выпустить их на улицу.
Исследователи предупреждают: предложенное ими решение хорошо подходит для ситуаций, где карты известны заранее, но на пути возникают динамические препятствия, что характерно для использования роботов в домашних условиях, на складах или даже в космических вездеходах. Для того чтобы роботы хорошо вписались в команду и помогали людям, они должны учиться и эффективно адаптироваться к человеческим предпочтениям. А новый метод как раз и обеспечивает это.
Больше информации об интересных событиях, тенденциях и фактах в сфере цифровой экономики, мнений экспертов, а главное — ярких рассказов о решениях на основе данных в социальной сфере, здравоохранении, культуре, образовании, благотворительной и волонтерской деятельности, читайте в новом проекте «DobroData. Данные на службе добра». Пусть тех, кто умеет делать мир лучше, станет больше! Возрастная маркировка: 12+