Сотрудники факультета информатики, математики и компьютерных наук Нижегородского филиала НИУ ВШЭ создали систему, способную определять эмоции по голосу.
Разработчики преобразовывали звук в изображения — спектрограммы, что позволило работать со звуком методами, применяемыми для распознавания изображений. В исследовании использовалась сверточная нейронная сеть глубинного обучения с архитектурой VGG-16. Нейронная сеть может распознать восемь различных состояний: «нейтральный», «спокойный», «счастливый», «грустный», «злой», «испуганный», «отвращение» и «удивление». Исследователи рассказали, что компьютер правильно определил эмоцию в 70% случаев.
Источник: hse.ru |