Исследователи из Монктонского университета (Канада), разработали первый в своем роде инструмент глубокого обучения ECOGEN, который может генерировать реалистичное пение птиц. Сгенерированные примеры затем можно использовать для обучения различных программ, распознающих голоса птиц. Это особенно важно в тех случаях, когда для обучения распознающей программы не хватает образцов. Добавление к набору реальных записей искусственно сгенерированных примеров позволило повысить точность распознавания голосов в среднем на 12%, говорится в статье, опубликованной создателями ECOGEN в журнале Methods in Ecology and Evolution.
Источник: Nicolas Lecomte |
ECOGEN рассчитывает спектрограммы реальных записей, а затем генерирует на их основе новые изображения. Эти спектрограммы затем преобразуются обратно в звук. Для обучения инструмента исследователи использовали 23784 записи пения птиц со всего мира — всего 264 вида. Исследователи полагают, что этот метод можно применить и к голосам млекопитающих, насекомых, амфибий и рыб (они тоже могут издавать звуки).