Оглавление:
Определение - Что означает «Схема на чтение»?
Схема на чтение относится к инновационной стратегии анализа данных в новых инструментах обработки данных, таких как Hadoop и другие более сложные технологии баз данных. В схеме для чтения данные применяются к плану или схеме, когда они извлекаются из сохраненного местоположения, а не по мере их поступления.
Техопедия объясняет Схему на Чтении
В более старых технологиях баз данных применялась стратегия принудительной реализации схемы при записи - иными словами, данные должны были применяться к плану или схеме при их поступлении в базу данных. Это было сделано частично для обеспечения согласованности данных, и это является одним из основных преимуществ схемы при записи. При наличии схемы чтения лицам, обрабатывающим данные, возможно, потребуется проделать больше работы для идентификации каждого фрагмента данных, но здесь гораздо больше универсальности.
Принципиально дизайн схемы на чтение дополняет основные области применения Hadoop и связанных с ним инструментов. Компании хотят эффективно собирать много данных и хранить их для определенных целей. Тем не менее, они могут ценить сбор нечистых или противоречивых данных больше, чем строгий режим обеспечения соблюдения данных. Другими словами, Hadoop может обеспечить получение широкого спектра различных маленьких кусочков данных, которые могут быть не полностью организованы. Затем, когда эта информация используется, она организуется. Применение старой системы базы данных при записи означает, что менее организованные данные, вероятно, будут выброшены.
Другой способ это сделать - схема записи лучше подходит для получения очень чистых и согласованных наборов данных, но эти наборы данных могут быть более ограниченными. Схема при чтении обеспечивает более широкую сеть и обеспечивает более разностороннюю организацию данных. Эксперты также отмечают, что проще создать два разных представления одних и тех же данных со схемой на чтение.
Эта стратегия «схема на чтение» - одна из важных причин того, почему Hadoop и связанные с ним технологии так популярны в современных корпоративных технологиях. Предприятия используют большие объемы необработанных данных для поддержки всех видов бизнес-процессов, применяя нечеткую логику и другие системы сортировки и фильтрации, включающие корпоративные хранилища данных и другие большие объемы данных.
