Специалисты Intel и Университета Райса убеждены, что методы оптимизации вполне способны избавить мир от нынешних затрат на обучение глубоких нейронных сетей — сегодня для этой цели применяются мощные графические процессоры, стоящие в разы дороже, чем центральные процессоры общего назначения. GPU принято использовать, поскольку при работе нейросетей выполняется огромное количество операций перемножения матриц, с которыми лучше всего справляются именно видеопроцессоры.
В рамках совместного исследования научные сотрудники двух организаций пришли к выводу о возможности сведения задачи глубинного обучения к задаче поиска, которую можно решить с использованием хеш-таблиц. Реализованный ими движок обучения SLIDE способен выполняться на обычных центральных процессорах, без использования специализированных программно-аппаратных архитектур. Недавно та же группа представила доработанную версию движка, производительность которой была повышена благодаря использованию ускорителей векторизации и работы с памятью, которыми оснащаются процессоры новых поколений.
Как выяснили разработчики, благодаря избавлению от операций перемножения матриц обучение моделей искусственного интеллекта с помощью улучшенного SLIDE на обычном процессоре происходит в 15 раз быстрее, чем на графическом.