DWH vs Data Lake vs Data Mart

Решения для хранения данных, отличные от Data Warehouse

Хранилище содержит уже преобразованные, структурированные данные, готовые к последующей обработке и анализу. Это делает Data Warehouse удобным инструментом для решения бизнес-задач. Но DWH — не единственный способ хранения и аналитической обработки данных. Например, можно вспомнить Data Lake (озёра данных) и Data Mart (витрины данных). Эти подходы к работе с большими данными тоже активно используются компаниями. Попробуем сравнить их с Data Warehouse.

Data Lake

В Data Lake данные поступают и хранятся в необработанном виде без какой-либо упорядоченной структуры. Подобного рода хранилища полезны, когда хочется обрабатывать и анализировать данные из различных внешних источников, которые проблематично пробрасывать в контур компании. Например, в таких хранилищах можно обрабатывать данные для проектирования маркетинговых стратегий.

Data Mart

Витрина данных — это разновидность хранилища, в котором содержится информация об определённом бизнес-направлении или департаменте предприятия. Витрина строится из данных, которые запрашиваются чаще других или нужны для выполнения задач. Этот подход удобен тем, что хранилище не нагружается дополнительными расчётами, а нужные данные становится проще найти.

Источники:

Last updated