Специалисты МТИ, Гарвардского университета и Fujitsu разобрались, как особенности учебных данных влияют на способность нейронной сети к распознаванию объектов, которые она еще не «видела».
Для исследования авторы подготовили наборы данных со снимками разных объектов, сделанными с различных ракурсов. Ученые варьировали степень разнообразия — менее разнообразным считался набор данных с объектами, снятыми только с одного ракурса. По итогам выяснилось, что при увеличении разнообразия нейросеть способна лучше «узнавать» знакомые предметы с других ракурсов — предвзятость была меньшей, но могла потерять способность классифицировать объекты, которые ей уже встречались.
Системы искусственного интеллекта нередко обучают одновременному выполнению нескольких связанных задач — считается, что так повышается результативность решения каждой из них. Однако исследователи выяснили, что это не так — оказалось, что модель, которую учат каждой задаче по отдельности, лучше преодолевает предвзятость. Как объясняют авторы, при обучении распознаванию объектов изображения в нейросети появляются два типа нейронов — одни специализируются на определении категории объекта, другие — на определении ракурса. Оказалось, что при раздельном обучении такое деление нейронов более выражено — эту особенность ученые хотят исследовать дальше.