Оглавление:
- Определение - Что означает параллельный анализ данных?
- Техопедия объясняет параллельный анализ данных
Определение - Что означает параллельный анализ данных?
Параллельный анализ данных - это метод анализа данных с использованием параллельных процессов, которые выполняются одновременно на нескольких компьютерах.
Этот процесс используется при анализе больших наборов данных, таких как большие записи телефонных звонков, сетевые журналы и веб-хранилища текстовых документов, которые могут быть слишком большими, чтобы помещаться в одну реляционную базу данных. Этот метод часто используется в аналитике больших данных и общем анализе данных.
Техопедия объясняет параллельный анализ данных
Основной концепцией параллельного анализа данных является параллелизм, определяемый в вычислениях как одновременное выполнение процессов.
Это часто достигается с помощью нескольких процессоров или даже нескольких компьютеров и является обычной практикой в распределенных вычислениях. При параллельном анализе данных разные компьютеры, выполняющие различные аспекты анализа данных, одновременно выполняют эти процессы, а затем объединяют результаты в один большой отчет.
Причина этого параллелизма состоит в основном в ускорении анализа, но также в том, что некоторые наборы данных могут быть слишком динамичными, слишком большими или просто слишком громоздкими для эффективного размещения в одной реляционной базе данных. В результате эти наборы данных размещаются в разных базах данных, оптимизированных для данных такого типа, и на разных компьютерах, поэтому линейный анализ просто не будет эффективным вариантом.
