Оглавление:
Определение - Что означает дедупликация данных?
Дедупликация данных - это метод сжатия данных, при котором избыточные или повторные копии данных удаляются из системы. Он реализован в механизмах резервного копирования и сетевых данных и позволяет хранить один уникальный экземпляр данных в базе данных или информационной системе (ИС).
Дедупликация данных также известна как интеллектуальное сжатие, хранение в одном экземпляре, факторизация общности или сокращение данных.
Техопедия объясняет дедупликацию данных
Дедупликация данных работает путем анализа и сравнения входящих сегментов данных с ранее сохраненными данными. Если данные уже присутствуют, алгоритмы дедупликации данных отбрасывают новые данные и создают ссылку. Например, если файл документа резервируется с изменениями, предыдущий файл и примененные изменения добавляются в сегмент данных. Однако, если нет никакой разницы, более новый файл данных отбрасывается, и создается ссылка. Аналогично, алгоритм дедупликации данных сканирует исходящие данные в сетевом соединении, чтобы проверить наличие дубликатов, которые удаляются для увеличения скорости передачи данных.
