Усложнение и развитие систем работы с данными, внедряемыми в рамках проектов импортозамещения, означает решение новых задач – по сути, речь идет о изменении самих подходов к владению данными. Переход от разрозненных хранилищ к платформам данных требует специфических решений по каталогизации, управлению, организации разработки и обеспечению безопасности. Компаниям экономики данных требуется не просто импортозамещение «как есть», а качественное изменение корпоративных ИТ-ландшафтов.
Традиционные системы хранения не могут расширяться бесконечно или хотя бы достаточно быстро, что особенно критично для задач глубинного обучения, в случае когда данных больше, чем может поместиться на одной машине. Поэтому для поддержки работы с большими данными все чаще применяются распределенные горизонтально масштабируемые архитектуры хранения и обработки в памяти.
KDD — обнаружение знаний в базах данных — реальный способ повышения эффективности работы. Вопрос не в том, нужны ли такие технологии, а в том, как их применить в каждом конкретном случае.