Оглавление:
Определение - Что означает извлечение данных?
Извлечение данных - это место, где данные анализируются и просматриваются для извлечения соответствующей информации из источников данных (например, из базы данных) по определенному шаблону. Дальнейшая обработка данных, которая включает добавление метаданных и другую интеграцию данных; другой процесс в потоке данных.
Большая часть извлечения данных происходит из неструктурированных источников данных и различных форматов данных. Эти неструктурированные данные могут быть в любой форме, например, таблицы, индексы и аналитика.
Техопедия объясняет извлечение данных
Данные в хранилище могут поступать из разных источников, хранилище данных требует трех разных методов для использования входящих данных. Эти процессы известны как извлечение, преобразование и загрузка (ETL).
Процесс извлечения данных включает извлечение данных из растрепанных источников данных. Затем извлечения данных загружаются в промежуточную область реляционной базы данных. Здесь используется логика извлечения, а исходная система запрашивается для данных с использованием интерфейсов прикладного программирования. После этого процесса данные теперь готовы пройти этап преобразования процесса ETL.
