Q:
Почему менеджеры должны остерегаться избыточности базы данных?
A:Менеджеры баз данных и другие ИТ-специалисты должны остерегаться «избыточности базы данных» или «избыточности данных» из-за всех негативных воздействий, которые избыточность может оказать на систему базы данных или среду. Везде, где определенная часть данных дублируется, либо в двух полях базы данных, либо в двух разных средах базы данных, это может иметь последствия для извлечения данных.
Одна из первых причин избежать избыточности данных заключается в том, что она может быть расточительной или чрезмерной.
Важно отметить, что некоторые типы избыточности данных планируются для защиты и резервного копирования данных. Однако другие возникают из-за плохого или неэффективного кодирования или отсутствия внимания к лучшим практикам. Во многих случаях большие объемы избыточности данных приводят к быстрому росту базы данных за пределы разумного размера. С учетом этого предпринимаются многочисленные усилия по борьбе с избыточностью данных, чтобы сэкономить место в базе данных и, следовательно, снизить затраты и затраты на обслуживание. Тем не менее, это должно быть сделано с ориентацией на практичность - инженеры могут практиковать то, что называется дедупликацией данных, но это должно быть сделано эффективным способом.
Например, менеджеры баз данных могут исследовать что-то вроде удаления строки из повторяющегося поля, такого как имя общего клиента или компании, и замены ее простой ссылкой на переменную, где строка хранится где-то еще. Это может сэкономить место в базе данных, но также может потребовать большей активности сервера для выполнения заданного запроса, поэтому он может быть не таким эффективным, как кажется.
Еще одна важная причина для дедупликации данных или избежания избыточности данных заключается в возможной путанице. Избыточные данные в базе данных могут вызывать различные типы аномалий. Один из них называется аномалией обновления - аномалии обновления возникают, когда запись повторно вводится с обновленной информацией, но обновление не возвращает ее к исходной записи. В такой ситуации может быть три разных записи для конкретного сотрудника компании с тремя разными названиями должностей и тремя разными адресами, потому что информация о человеке обновлялась не во всей базе данных, а только в последней введенной записи.
Как полагают эксперты, администраторы баз данных могут избежать избыточности данных по своей структуре. Они также могут участвовать в практике нормализации данных, которая может исправить аномалии обновления и другие виды аномалий путем стандартизации способов хранения записей таблиц базы данных. Администраторы баз данных также могут проводить дедупликацию данных, чтобы очистить и стандартизировать данные другими способами. Все это служит для создания более чистых таблиц базы данных, делая записи базы данных более согласованными и предотвращая все головные боли и сложные проблемы, связанные с незапланированной избыточностью данных.