Оглавление:
Определение - Что означает Разнообразие?
Разнообразие - это компонент инфраструктуры 3 В, который используется для определения различных типов данных, категорий и связанного управления хранилищем больших данных. Разнообразие позволяет понять уникальность разных классов больших данных и их сравнение с другими типами данных.
Техопедия объясняет разнообразие
Разнообразие определяет характер данных, которые существуют в больших данных. Это включает в себя различные форматы данных, семантику данных и типы структур данных.
Разнообразие направлено на предоставление различных методов для разрешения и управления разнообразием данных в больших данных, таких как:
- Методы индексирования для связи данных с различными и несовместимыми типами
- Профилирование данных для поиска взаимосвязей и отклонений между источниками данных
- Импорт данных в общепринятые и используемые форматы, такие как расширяемый язык разметки (XML)
- Управление метаданными для обеспечения согласованности контекстных данных
