Исследование, выполненное аналитиками IDC по заказу корпорации EMC, показало, что в 2012 году в мире было создано порядка 2,8 зеттабайт данных. К 2020 году объем «цифровой вселенной» дойдет до 40 зеттабайт. При этом в настоящее время анализу подвергается лишь 0,5% создаваемых данных. Объем данных, генерируемых машинами, к 2020 году увеличится в 15 раз, а развивающиеся страны в общей сложности обгонят развитые по объему создаваемых данных, полагают аналитики. Сейчас Индии и Китаю принадлежит соответственно 4 и 13% «цифровой вселенной», но в 2020 году Китай будет производить 22% данных в мире. На каждого жителя Земли будет приходиться примерно 5247 гигабайт данных, однако большая часть из них будет не структурирована и представлена в форме отдельных файлов. 46,7% данных, хранящихся в облаке, будут относиться не к корпоративным, а к развлекательным.
По некоторым оценкам, при условии классификации и анализа данных пользу можно было извлечь примерно из 23% сгенерированных в 2012 году данных. К 2020 году доля полезных для анализа данных вырастет до 33%. Инвестиции в оборудование, программы, сервисы, связь и работу специалистов для поддержки инфраструктуры «цифровой вселенной» к 2020 году вырастут на 40%.