Оглавление:
- Определение - Что означает предварительная обработка данных?
- Techopedia объясняет предварительную обработку данных
Определение - Что означает предварительная обработка данных?
Предварительная обработка данных - это метод анализа данных, который включает преобразование необработанных данных в понятный формат. Реальные данные часто бывают неполными, непоследовательными и / или недостающими в определенном поведении или тенденциях и могут содержать много ошибок. Предварительная обработка данных является проверенным методом решения таких проблем. Предварительная обработка данных подготавливает необработанные данные для дальнейшей обработки.
Предварительная обработка данных используется приложениями на основе баз данных, такими как управление взаимоотношениями с клиентами и приложения на основе правил (например, нейронные сети).
Techopedia объясняет предварительную обработку данных
Данные проходят серию шагов во время предварительной обработки:
- Очистка данных: данные очищаются с помощью таких процессов, как заполнение пропущенных значений, сглаживание зашумленных данных или устранение несоответствий в данных.
- Интеграция данных: данные с различными представлениями объединяются, и конфликты в данных разрешаются.
- Преобразование данных: данные нормализуются, агрегируются и обобщаются.
- Сокращение данных. Этот шаг направлен на представление сокращенного представления данных в хранилище данных.
- Дискретизация данных: включает сокращение числа значений непрерывного атрибута путем деления диапазона интервалов атрибута.
