Оглавление:
Определение - Что означает Apache Sqoop?
Apache Sqoop («SQL to Hadoop») - это консольное приложение на основе Java, предназначенное для передачи больших объемов данных между Apache Hadoop и хранилищами данных, отличных от Hadoop, такими как реляционные базы данных, базы данных NoSQL и хранилища данных. Версия 1.4.4 была выпущена 31 июля 2013 года.Техопедия объясняет Apache Sqoop
Предприятия, использующие Hadoop, считают необходимым перенести часть своих данных из традиционных систем управления реляционными базами данных (RDBMS) в экосистему Hadoop.
Sqoop, неотъемлемая часть Hadoop, может выполнять эту передачу в автоматическом режиме. Более того, данные, импортированные в Hadoop, могут быть преобразованы с помощью MapReduce перед экспортом обратно в RDBMS. Sqoop также может генерировать классы Java для программного взаимодействия с импортированными данными.
Sqoop использует архитектуру на основе коннекторов, которая позволяет использовать плагины для соединения с внешними базами данных.
