Оглавление:
Определение - что означает профилирование данных?
Профилирование данных - это метод, используемый для проверки данных для различных целей, таких как определение точности и полноты. Этот процесс проверяет источник данных, такой как база данных, чтобы выявить ошибочные области в организации данных. Развертывание этого метода улучшает качество данных.
Профилирование данных также называется обнаружением данных.
Техопедия объясняет профилирование данных
Профилирование данных - это метод изучения данных, доступных в источнике данных, и сбора статистики и информации об этих данных. Такая статистика помогает определить использование и качество данных метаданных. Этот метод широко используется в корпоративных хранилищах данных.
Профилирование данных проясняет структуру, отношения, содержание и правила получения данных, которые помогают в понимании аномалий в метаданных. Профилирование данных использует различные виды описательной статистики, включая среднее, минимальное, максимальное, процентиль, частоту и другие агрегаты, такие как количество и сумма. Дополнительная информация метаданных, полученная во время профилирования, - это тип данных, длина, дискретные значения, уникальность и распознавание абстрактных типов.