Оглавление:
Определение - Что означает Data Lake?
Озеро данных - это массивное, легко доступное, централизованное хранилище больших объемов структурированных и неструктурированных данных.Техопедия объясняет, что такое озеро
Архитектура озера данных - это универсальный подход к большим данным. Данные не классифицируются, когда они хранятся в хранилище, так как значение данных с самого начала неясно. В результате подготовка данных исключается. Таким образом, озеро данных менее структурировано по сравнению с обычным хранилищем данных. Когда к данным обращаются, только тогда они классифицированы, организованы или проанализированы.
Hadoop, платформа с открытым исходным кодом для обработки и анализа больших данных, может использоваться для просеивания данных в хранилище.
