Дом Базы данных Что такое дедупликация данных? - определение из техопедии

Что такое дедупликация данных? - определение из техопедии

Оглавление:

Anonim

Определение - Что означает дедупликация данных?

Дедупликация данных - это метод сжатия данных, при котором избыточные или повторные копии данных удаляются из системы. Он реализован в механизмах резервного копирования и сетевых данных и позволяет хранить один уникальный экземпляр данных в базе данных или информационной системе (ИС).

Дедупликация данных также известна как интеллектуальное сжатие, хранение в одном экземпляре, факторизация общности или сокращение данных.

Техопедия объясняет дедупликацию данных

Дедупликация данных работает путем анализа и сравнения входящих сегментов данных с ранее сохраненными данными. Если данные уже присутствуют, алгоритмы дедупликации данных отбрасывают новые данные и создают ссылку. Например, если файл документа резервируется с изменениями, предыдущий файл и примененные изменения добавляются в сегмент данных. Однако, если нет никакой разницы, более новый файл данных отбрасывается, и создается ссылка. Аналогично, алгоритм дедупликации данных сканирует исходящие данные в сетевом соединении, чтобы проверить наличие дубликатов, которые удаляются для увеличения скорости передачи данных.

Что такое дедупликация данных? - определение из техопедии