Sqoop es una aplicación de interfaz de línea de comandos para transferir datos entre bases de datos relacionales y Hadoop . [1]
El proyecto Apache Sqoop se retiró en junio de 2021 y se trasladó a Apache Attic. [2]
Sqoop admite cargas incrementales de una sola tabla o una consulta SQL de formato libre , así como trabajos guardados que se pueden ejecutar varias veces para importar actualizaciones realizadas a una base de datos desde la última importación. Las importaciones también se pueden utilizar para completar tablas en Hive o HBase . [3] Las exportaciones se pueden utilizar para colocar datos de Hadoop en una base de datos relacional. Sqoop recibió el nombre de "SQL-to-Hadoop". [4] Sqoop se convirtió en un proyecto Apache de alto nivel en marzo de 2012. [5]
Informatica ofrece un conector basado en Sqoop desde la versión 10.1. Pentaho ofrece pasos de conector basados en Sqoop de código abierto , Sqoop Import [6] y Sqoop Export [7] en su suite ETL Pentaho Data Integration desde la versión 4.5 del software. [8] Microsoft utiliza un conector basado en Sqoop para facilitar la transferencia de datos desde bases de datos de Microsoft SQL Server a Hadoop. [9] Couchbase, Inc. también ofrece un conector Couchbase Server -Hadoop mediante Sqoop. [10]
El trabajo de importación de Sqoop le permite importar datos desde una base de datos relacional al sistema de archivos distribuidos de Hadoop (HDFS) mediante Apache Sqoop.
El trabajo Exportación de Sqoop le permite exportar datos desde Hadoop a un RDBMS utilizando Apache Sqoop.
Analytics 4.5 de Pentaho ahora está certificado en las últimas versiones de Cloudera, Cloudera Enterprise 4.0 y CDH4. Pentaho también anunció que sus capacidades de estudio de diseño visual se han ampliado a los componentes Sqoop y Oozie de Hadoop.