VK Tech стала первой в России компанией, предоставляющей возможность построения корпоративного Data Lakehouse на управляемых облачных сервисах. Запуск Data Lakehouse стал возможен благодаря появлению на платформе VK Cloud сервиса Cloud Trino для обработки больших потоков данных из разнообразных источников. Data Lakehouse в VK Cloud — это новый подход к хранению и анализу данных, сочетающий лучшие элементы «озер данных» (Data Lake) и корпоративного хранилища данных (Data Warehouse). Он позволяет снизить нагрузку на системы хранения данных, удешевить хранение неструктурированных данных и эффективно их анализировать за счет разделения вычислительных узлов и хранилищ данных. Data Lakehouse на платформе VK Cloud реализован на базе S3-совместимого объектного хранилища собственной разработки и высокопроизводительного SQL-движка Cloud Trino на базе Kubernetes. Использование доработанных популярных открытых компонентов в составе Data Lakehouse позволяет компаниям получить современный стек для работы с крупными проектами, с оплатой только за фактически потребленные ресурсы, без необходимости покупать лицензии. Благодаря параллельному подключению к нескольким источникам Cloud Trino позволяет сократить время на ETL-процессы, ускорить обработку сырых данных и дает возможность пользователям из различных подразделений компаний быстро получать доступ к данным, чтобы строить аналитику в режиме self-service. Облачный Kubernetes позволяет оперативно масштабировать инфраструктуру по мере роста потребностей бизнеса.