При внедрении систем генеративного ИИ на предприятиях можно передать учебные данные поставщику большой языковой модели, чтобы обучить ее специализированный вариант, или создать локальную малую языковую модель с ограниченными возможностями. Сегодня все чаще применяют более эффективный подход федеративного обучения. Его принцип в том, что большую языковую модель обучают на конфиденциальных данных предприятия в месте их хранения без отправки в облако поставщика модели.
Это дает возможность использовать одновременно закрытую информацию компании и общие знания мощных моделей вроде GPT-4 или Google Gemini без опасности компрометации. Что еще важнее, отпадает необходимость перемещения петабайтов информации в облако, где размещена модель.
К примеру, таким образом модель общего назначения можно обучить с использованием данных финансовых транзакций с клиентами, складских систем и цепочки поставок. Благодаря этому она сможет выдавать больше полезной для конкретной компании информации и делать более точные прогнозы, чем малая модель, разработанная самой организацией.
Федеративный подход обеспечивает значительное экономическое преимущество — не нужно ни развертывать отдельную инфраструктуру для ИИ, ни оплачивать перемещение огромных объемов данных. На сегодня существуют фреймворки, с помощью которых можно легко реализовать интеграцию между внутренними малыми языковыми моделями и облачными большими. Таким образом формируется гибридная архитектура, минимизирующая риски, особенно для организаций, имеющих дело с конфиденциальными данными или работающих в регулируемых отраслях. К тому же подобная система проще устроена, благодаря чему ее развертывание проходит легче и быстрее.
Еще один плюс — возможность подключения больших языковых моделей, ориентированных на конкретную отрасль, хостинг которых, как правило, осуществляет иной поставщик, чем оператор модели общего назначения.
Таким образом, федеративное обучение имеет все шансы стать фактическим стандартом архитектуры корпоративных ИИ-систем. Однако внедрение следует начинать с небольших пилотных проектов. При этом важно заранее стандартизировать методику разметки данных, а также обеспечить надежные сетевые соединения между источниками информации и, при необходимости, наличие пограничных компьютерных систем достаточной мощности.