Оглавление:
Определение - Что означает спор данных?
Обработка данных - это особый тип управления данными, который возникает благодаря новым программным возможностям, представляющим большие, грязные и разнообразные наборы данных, которые должны входить в сервис-ориентированную архитектуру (SOA) для целей анализа и использования. Обработка данных, как правило, включает в себя множество различных сложных методов обработки нестандартных или разнородных данных и манипулирования ими для бизнес-случаев.
Техопедия объясняет спор данных
Это может звучать как неформальный термин, но спор данных на самом деле занимает особое место в управлении данными. Один из полезных способов понять обработку данных - сопоставить их с часто более формальной методологией извлечения, преобразования и загрузки (ETL). Обработка данных имеет разные аспекты и варианты использования, чем ETL. Это часто делается опытными специалистами по данным или другими специалистами, работающими в непосредственной близости. В некотором смысле, обработку данных можно назвать типом ETL «с открытым исходным кодом», в котором те инженеры, которые имеют дело с данными, могут быть более «практичными» или использовать более ручные методы извлечения.
Для тех, кто действительно понимает усовершенствованные процессы, с помощью которых разнородные данные отбираются, сортируются и подаются в корпоративные архитектуры, спор данных на самом деле является очень важной темой. ИТ-специалисты рассматривают широкий спектр инструментов, ресурсов и методов, чтобы извлечь выгоду из грязных, необработанных или неструктурированных данных.