Amazon Redshift es un producto de almacenamiento de datos que forma parte de la plataforma de computación en la nube más grande Amazon Web Services . [1] Está construido sobre la tecnología de la empresa de almacenamiento de datos de procesamiento paralelo masivo (MPP) ParAccel (posteriormente adquirida por Actian ), [2] para manejar conjuntos de datos a gran escala y migraciones de bases de datos . [3] Redshift se diferencia de la otra oferta de base de datos alojada de Amazon, Amazon RDS , en su capacidad para manejar cargas de trabajo analíticas en conjuntos de datos de big data almacenados por un principio DBMS orientado a columnas . Redshift permite hasta 16 petabytes de datos en un clúster [4] .
Amazon Redshift se basa en una versión anterior de PostgreSQL 8.0.2 , y Redshift ha realizado cambios en esa versión. [5] [6] Se lanzó una versión beta preliminar inicial en noviembre de 2012 [7] y una versión completa estuvo disponible el 15 de febrero de 2013. El servicio puede manejar conexiones desde la mayoría de las otras aplicaciones que utilizan conexiones ODBC y JDBC . [8] Según el informe Cloud Data Warehouse publicado por Forrester en el cuarto trimestre de 2018, Amazon Redshift tuvo la mayor cantidad de implementaciones de almacenamiento de datos en la nube, con más de 6500 implementaciones. [9]
Redshift utiliza el procesamiento y la compresión en paralelo para disminuir el tiempo de ejecución de los comandos . [10] Esto permite a Redshift realizar operaciones en miles de millones de filas a la vez. [11] Esto también hace que Redshift sea útil para almacenar y analizar grandes cantidades de datos de registros o transmisiones en vivo a través de una fuente como Amazon Kinesis Data Firehose. [11]
Amazon ha incluido a varios propietarios de software de inteligencia empresarial como socios y ha probado herramientas en su programa "APN Partner", [12] incluyendo Actian , Actuate Corporation , Alteryx , Dundas Data Visualization , IBM Cognos , InetSoft , Infor , Logi Analytics , Looker , MicroStrategy , Pentaho , [13] [14] Qlik , SiSense , Tableau Software y Yellowfin. Las empresas asociadas que proporcionan herramientas de integración de datos incluyen Informatica y SnapLogic . Los socios de consultoría e integración de sistemas incluyen Accenture , Deloitte , Capgemini y DXC Technology .
El "rojo" en el nombre de Redshift alude a Oracle , una empresa de tecnología informática de la competencia a la que a veces se hace referencia informalmente como "Big Red" debido a su color corporativo rojo. Por lo tanto, los clientes que decidan trasladar sus bases de datos de Oracle a Redshift estarían "trasladándose" de "Red". [15]
Pentaho ha certificado su plataforma de análisis de negocios e integración de datos para trabajar con Amazon Redshift.
Luego se transformó, se perfeccionó y se introdujo de inmediato en Amazon Redshift.