В рамках конференции Informatica Day 2017, проведенной компанией Informatica в рамках мирового технологического турне совместно с российским партнером DIS Group, прозвучали сообщения о выходе новых решений, ориентированных на конкретные насущные задачи предприятий различного масштаба. Помимо технологических анонсов, был широко представлен опыт заказчиков. Одни из наиболее масштабных российских проектов реализуются в Сбербанке, который использует технологии Informatica около шести лет. Как рассказал Борис Рабинович, директор центра компетенции развития BI-технологий компании «Сбербанк Технологии», ярким примером применения продуктов Informatica является проект внедрения и использования платформы In-Memory Data Fabric компании GridGain Systems. Технологии Informatica PowerCenter и Test Data Management помогают обеспечить интеграцию баз данных Oracle и Teradata. В текущем году планируется реализовать пилотные проекты по выгрузке данных из Oracle в Hadoop и из Teradata в Hadoop, а также из источников Hive в приемники на базе других СУБД. Кроме того, предполагается обеспечить интеграцию с платформой GridGain, системами машинного обучения и осуществить миграцию с прежних решений на новую платформу.
Еще одно интересное направление проектов Сбербанка — обезличивание данных, призванное обеспечить защищенность персональных данных клиентов банка и предотвратить их утечки в ходе разработок, а также нагрузочного и функционального тестирования совершенствуемых и новых систем. С помощью автоматизированной системы на базе Informatica Test Data Management уже удалось обезличить 30 баз данных общей емкостью 50 Тбайт, используя при этом около 150 уникальных правил. Применяемая в банке технология обезличивания позволяет сохранять некоторые важные признаки, такие, например, как пол клиента, контрольный разряд номера карты и пр. В течение ближайшего года планируется обезличить еще 150 реляционных баз данных и выстроить процесс обезличивания данных в Hadoop, GridGain, а также выбрать технологию псевдообезличивания в Hadoop с применением шифрования, динамического маскирования и других методов, которая позволит безопасно предоставлять данные аналитикам.
В компании Tele2 технологии Informatica PowerCenter применяются в качестве основного ETL-средства в первую очередь при загрузке корпоративного хранилища данных, куда стекается информация из более чем 100 источников. Ключевые направления использования хранилища данных — подготовка кампаний целевого маркетинга и расчет KPI на основе единого слоя данных. По словам Ники Пономаревой, руководителя департамента развития систем машинного обучения и бизнес-анализа Tele2, проект хранилища данных окупился гораздо быстрее, чем рассчитывали. Примечательно, что в ходе его реализации был сформирован офис проектов Больших Данных.