В компании «Яндекс» разработали принципы этичной работы с технологиями синтеза речи на базе нейросетей. Такие меры помогут заказчикам, партнерам и звукозаписывающим студиям сделать более прозрачной работу с дикторами и записями синтезированных голосов, считают в компании. Среди принятых принципов:

  • получение согласия на использование голоса в модели синтеза у человека, которому он принадлежит, или его законных представителей (при этом согласие на обработку аудиозаписи, например очисткой от шумов, повышением разборчивости речи или перевода на другой язык, можно не запрашивать);
  • информирование диктора о том, как работает синтез и где будет использоваться его голос;
  • безопасное хранение записей — к исходному коду и результатам синтеза сторонние пользователи доступа не получают.

«Яндекс» оставляет за собой право отозвать доступ к технологии синтеза речи у стороннего пользователя, если компании станет известно о ее неправомерном применении. Ранее в Союзе дикторов России предложили закрепить в законодательстве понятие охраны голоса, запретив отчуждение прав диктора при использовании технологии голосового синтеза, перейти на лицензионные договоры «с четко определенным сроком действия», а также закрепить условие, что запись синтезированного голоса может использоваться только в конкретном проекте. В сентябре 2024 года в Госдуму внесли законопроект, который предлагает установить охрану голоса как «объекта личных неимущественных прав гражданина по аналогии с изображением гражданина, в том числе в случаях имитации голоса или путем синтеза речи в режиме реального времени». Авторы законопроекта предполагают, что голос человека может использоваться только с его согласия.