В прошлом, когда мы думали о цифровых данных, имело смысл разделять данные между транзакционными данными, данными, собранными в бизнес-приложениях, хранящимися в таблицах базы данных и представленными инструментами BI, и всеми другими данными: электронная почта, веб-страницы, изображения, видео и так далее. В настоящее время мы склонны называть такие «другие данные» неструктурированными данными.
Тем не менее, его можно было проанализировать, и программное обеспечение для извлечения ценности из таких данных преодолело пропасть Именно этот аналитический императив больше, чем что-либо еще, породил первоначальную концепцию озера данных, хранилища данных для обоих видов данных и, кроме того, для данных, собранных из нескольких внешних источников, некоторые из которых были неизбежно неструктурированы.
В этой статье мы рассмотрим, как новая экосистема, созданная озером данных, больше не будет полностью состоять из транзакций (или событий) бизнеса. Он также будет включать в себя данные из других источников, которые бизнес использует для выполнения аналитики и информирования своих пользователей о важной информации, на которой могут основываться решения. Система учета будет, как всегда, золотой копией корпоративных данных и журналом аудита ИТ-деятельности бизнеса.