Оглавление:
- Определение - Что означает Извлечение Преобразования нагрузки (ETL)?
- Techopedia объясняет нагрузку извлечения трансформации (ETL)
Определение - Что означает Извлечение Преобразования нагрузки (ETL)?
Извлечение нагрузки преобразования (ETL) - это процесс извлечения, преобразования и загрузки во время использования базы данных, но особенно во время использования хранилища данных. Он включает в себя следующие подпроцессы:
- Получение данных из внешних источников хранения или передачи данных
- Преобразование данных в понятный формат, где данные обычно хранятся вместе с кодом обнаружения и исправления ошибок для удовлетворения эксплуатационных потребностей.
- Передача и загрузка данных на принимающую сторону
Techopedia объясняет нагрузку извлечения трансформации (ETL)
На первом этапе процесса ETL основное внимание уделяется извлечению данных из источника хранения. Большинство проектов хранения данных объединяют данные, полученные из различных исходных систем. Каждая отдельная система может использовать отдельную организацию или формат данных. Распространенными структурами источников данных являются реляционные базы данных и файлы чистых данных. Они также могут включать в себя шаблоны нереляционных баз данных, такие как системы управления информацией или другие структуры данных, такие как метод доступа к виртуальной памяти (VSAM) или метод индексированного последовательного доступа (ISAM). Источники данных могут даже включать внешние источники, такие как данные, поступающие из Интернета или через систему сканирования.
Фаза преобразования использует ряд правил или операций для извлечения чистых данных из источника, чтобы доставить данные в их окончательном виде для манипулирования на принимающей стороне. Некоторые источники данных требуют очень мало или даже не обрабатывают данные. Иногда одно или несколько преобразований могут иметь решающее значение для соответствия бизнес-требованиям и техническим требованиям целевой базы данных.
Этап загрузки или передачи направлен на отправку данных принимающей стороне, которая, вероятно, будет хранилищем данных. В зависимости от потребностей приложения этот процесс может быть очень простым или очень сложным. Некоторые методы хранения данных могут заменить старые данные накопительными данными. Обновление извлеченных данных обычно выполняется на периодической основе.