Оглавление:
- Определение - что означает DataStage Parallel Extender (DataStage PX)?
- Techopedia объясняет DataStage Parallel Extender (DataStage PX)
Определение - что означает DataStage Parallel Extender (DataStage PX)?
DataStage Parallel Extender (DataStage PX) - это инструмент интеграции данных IBM. Это один из многих широко используемых инструментов извлечения, преобразования и загрузки (ETL) в индустрии хранилищ данных. Этот инструмент может собирать информацию из разнородных источников, выполнять преобразования в соответствии с потребностями бизнеса и загружать данные в соответствующие хранилища данных.
DataStage PX также может называться DataStage Enterprise Edition.
Techopedia объясняет DataStage Parallel Extender (DataStage PX)
DataStage Parallel Extender имеет параллельную архитектуру для обработки данных. В DataStage PX реализованы два основных типа параллелизма: параллелизм конвейера и секций. Возможность параллельной обработки данных значительно ускоряет обработку данных.
DataStage Parallel Extender включает в себя множество этапов, посредством которых исходные данные обрабатываются и объединяются в целевые базы данных. Они определены в терабайтах. Помимо этапов, DataStage PX использует контейнеры для повторного использования компонентов и последовательностей заданий, чтобы запускать и планировать несколько заданий одновременно.
Обычно используемые этапы в DataStage Parallel Extender включают в себя:
- Трансформатор
- Агрегатор
- Набор данных
- копия
- Изменение применяется
- Изменить
- Фильтр
- Присоединиться
- Объединить
- Погляди
