Все сегодня говорят о Больших Данных, но мало кто знает, как с ними работать. Похоже, что соответствующие технологии уже вышли из юношества, но еще не повзрослели, а стек решений, что бы ни заявляли ведущие игроки, представляет собой весьма аморфное, хотя и динамичное образование.
Бытует мнение, что стандартизация почтовых адресов — задача тривиальная. Однако это не так: часто ее вполне можно отнести к области искусственного интеллекта. Распознавание, кластерный анализ и машинное обучение — это лишь неполный перечень направлений, с которыми приходится иметь дело при очистке адресных данных.