Поскольку авторское право сегодня охватывает практически все виды человеческого самовыражения, включая сообщения в блогах, фотографии, сообщения на форумах, фрагменты программного кода и государственные документы, было бы невозможно обучать современные модели ИИ без использования материалов, защищенных авторским правом, говорится в записке, которую компания OpenAI направила Специальному комитету по коммуникациям и цифровым технологиям Палаты лордов Великобритании. С июля прошлого года комитет занимается изучением проблем, связанных с большими языковыми моделями.
В ходе разработки приложений с генеративным искусственным интеллектом — например, ChatGPT или инструмента создания изображений Stable Diffusion — используются огромные объемы данных, собранных из Интернета, большая часть которых защищена авторскими правами. Многие издатели и авторы возражают против этого, указывая на то, что их работы используются без указания авторства или компенсации. В декабре прошлого года издание New York Times подало иск на OpenAI и Microsoft за использование материалов издания без разрешения.