Сфотографируйте свое блюдо, и искусственный интеллект мгновенно сообщит вам количество калорий, содержание жира и питательную ценность – гадать больше не придется, а дневники и записи вести не нужно. Благодаря системе, разработанной в инженерной школе Нью-Йоркского университета, этот футуристический сценарий стал намного ближе к реальности. Новый инструмент может пригодиться миллионам людей, желающим контролировать свой вес, бороться с диабетом и избегать других проблем со здоровьем, связанных с питанием. Предложенная технология использует передовые алгоритмы глубокого обучения, распознавая на изображениях продукты питания и рассчитывая их питательную ценность, в том числе количество калорий, белков, углеводов и жиров.

Источник: создано при помощи нейросети Kandinsky/fusionbrain.ai

Несмотря на кажущуюся простоту концепции задача распознавания пищевых продуктов на протяжении многих лет ставила исследователей в тупик. В отличие от объектов со стандартным внешним видом одно и то же блюдо может выглядеть совершенно по-разному в зависимости от того, кто его приготовил. Бургер из одного ресторана мало похож на бургер из другого, а домашние варианты лишь усиливают это разнообразие.

Вторая трудность была связана с оценкой размеров порций. Благодаря функции объемных вычислений исследователям удалось добиться точного измерения площади, занимаемой каждым из блюд на тарелке. Система сопоставляет площадь, занимаемую блюдом, с данными о его плотности и макроэлементах и осуществляет таким образом расчет питательных веществ. Интеграция объемных вычислений с моделью искусственного интеллекта позволяет проводить точный анализ без ручного ввода данных, автоматизируя процесс отслеживания рациона питания.

Третье серьезное препятствие касалось эффективности вычислений. Предыдущие модели требовали слишком большой вычислительной мощности, что приводило к невозможности их использования в реальном времени. Обработка данных в облаке сопровождалась задержками и вызывала вопросы, связанные с конфиденциальностью.

Источник: создано при помощи нейросети Kandinsky/fusionbrain.ai

В новой системе мощная технология распознавания изображений YOLOv8 используется в сочетании с инструментом ONNX Runtime, помогающим средствам искусственного интеллекта работать более эффективно. Программа идентификации продуктов питания запускается на веб-сайте, а не в виде загружаемого приложения, позволяя людям заходить туда с помощью браузера и анализировать блюда и их качество прямо на своем телефоне. При тестировании на примере ломтика пиццы система подсчитала, что в нем содержится 317 калорий, 10 г белка, 40 г углеводов и 13 г жира. Полученная пищевая ценность полностью соответствовала эталонным показателям. Аналогичные результаты выдавались и при анализе более сложных блюд.

В настоящее время ИИ может точно идентифицировать продукты питания примерно в 80% случаев, даже если происходит их наложение друг на друга или они частично затемнены.

Система развернута в виде веб-приложения, которое работает на мобильных устройствах, что делает ее потенциально доступной для всех, у кого есть смартфон. Исследователи называют ее «доказательством концепции» и полагают, что уже вскоре она может быть доработана для широкого применения в здравоохранении.

Источник: создано при помощи нейросети Kandinsky/fusionbrain.ai