SAP HANA ( HochleistungsANalyseAnwendung o aplicación analítica de alto rendimiento) es un sistema de gestión de bases de datos relacional , orientado a columnas y en memoria , desarrollado y comercializado por SAP SE . [2] [3] Su función principal como software que ejecuta un servidor de base de datos es almacenar y recuperar datos según lo soliciten las aplicaciones. Además, realiza análisis avanzados ( análisis predictivo , procesamiento de datos espaciales , análisis de texto, búsqueda de texto, análisis de transmisión , procesamiento de datos gráficos ) e incluye capacidades de extracción, transformación y carga (ETL), así como un servidor de aplicaciones .
Durante el desarrollo inicial de SAP HANA, SAP SE desarrolló o adquirió una serie de tecnologías . Estos incluían el motor de búsqueda TREX ( motor de búsqueda orientado a columnas en memoria ), P*TIME (plataforma de procesamiento de transacciones en línea (OLTP) en memoria adquirida por SAP en 2005) y MaxDB con su motor liveCache en memoria. [4] [5]
La primera gran demostración de la plataforma fue en 2011: equipos de SAP SE , el Instituto Hasso Plattner y la Universidad de Stanford demostraron una arquitectura de aplicación para análisis y agregación en tiempo real utilizando el nombre HYRISE. [6] El ex ejecutivo de SAP SE, Vishal Sikka , mencionó esta arquitectura como "La nueva arquitectura de Hasso". [7] Antes de que se estabilizara el nombre "HANA", la gente se refería a este producto como "Nueva base de datos". [8] El software se llamaba anteriormente "SAP High-Performance Analytic Appliance". [9]
En noviembre de 2010 se publicó un primer artículo de investigación sobre HYRISE. [10] El motor de investigación se lanzó posteriormente en código abierto en 2013, [11] y fue rediseñado en 2016 para convertirse en HYRISE2 en 2017. [12]
El primer producto se envió a finales de noviembre de 2010. [5] [13] A mediados de 2011, la tecnología había despertado interés, pero los clientes empresariales más experimentados consideraban que estaba "en los primeros días". [14] El soporte de HANA para SAP NetWeaver Business Warehouse (BW) se anunció en septiembre de 2011 y estará disponible en noviembre. [15]
En 2012, SAP promovió aspectos de la computación en la nube . [16] En octubre de 2012, SAP anunció una plataforma como oferta de servicio llamada SAP HANA Cloud Platform [17] [18] y una variante llamada SAP HANA One que utilizaba una cantidad menor de memoria. [19] [20]
En mayo de 2013, se anunció una oferta de nube privada gestionada denominada servicio HANA Enterprise Cloud. [21] [22]
En mayo de 2013, Business Suite en HANA estuvo disponible, lo que permite a los clientes ejecutar funciones de planificación de recursos empresariales de SAP en la plataforma HANA. [23] [24]
S/4HANA , lanzado en 2015, escrito específicamente para la plataforma HANA, combina funcionalidad para ERP , CRM , SRM y otros en un único sistema HANA. [25] S/4HANA pretende ser una suite empresarial simplificada que reemplace los sistemas ERP de la generación anterior . [26] Si bien es probable que SAP centre sus innovaciones en S/4HANA, algunos clientes que utilizan sistemas que no son HANA han expresado su preocupación de quedar atrapados en los productos de SAP. Dado que S/4HANA requiere un sistema SAP HANA para ejecutarse, los clientes que ejecutan aplicaciones de la suite empresarial de SAP en hardware no certificado por SAP tendrían que migrar a una base de datos HANA certificada por SAP si eligen las funciones ofrecidas por S/4HANA. [27]
En lugar de versiones , el software utiliza paquetes de servicios , denominados pilas de paquetes de soporte (SPS), para las actualizaciones. Las pilas de paquetes de soporte se publican cada 6 meses. [28]
En noviembre de 2016, SAP anunció SAP HANA 2, que ofrece mejoras en múltiples áreas, como la gestión de bases de datos y la gestión de aplicaciones, e incluye dos nuevos servicios en la nube: Análisis de texto y Análisis de observación de la Tierra. [ cita necesaria ] Los clientes de HANA pueden actualizar a HANA 2 desde SPS10 y superior. Los clientes que ejecutan SPS9 y versiones inferiores primero deben actualizar a SPS12 antes de actualizar a HANA 2 SPS01. [29]
Las distinciones clave entre HANA y los sistemas SAP de la generación anterior son que es una base de datos en memoria orientada a columnas , que combina operaciones OLAP y OLTP en un solo sistema; por lo tanto, en general, SAP HANA es un sistema de "procesamiento analítico y de transacciones en línea" (OLTAP), [30] también conocido como procesamiento híbrido transaccional/analítico (HTAP). El almacenamiento de datos en la memoria principal en lugar de en el disco proporciona un acceso más rápido a los datos y, por extensión, consultas y procesamiento más rápidos. [31] Si bien el almacenamiento de datos en memoria confiere ventajas de rendimiento, es una forma más costosa de almacenamiento de datos. Al observar los patrones de acceso a los datos, hasta el 85% de los datos en un sistema empresarial pueden ser accedidos con poca frecuencia [31] por lo tanto, puede ser rentable almacenar en memoria los datos a los que se accede con frecuencia, o "calientes", mientras que los datos "calientes" a los que se accede con menos frecuencia "Los datos se almacenan en el disco, un enfoque que SAP comenzó a admitir en 2016 y que denominó "niveles dinámicos". [32]
Los sistemas orientados a columnas almacenan todos los datos de una sola columna en la misma ubicación, en lugar de almacenar todos los datos de una sola fila en la misma ubicación (sistemas orientados a filas). Esto puede permitir mejoras de rendimiento para consultas OLAP en conjuntos de datos grandes y permite una mayor compresión vertical de tipos similares de datos en una sola columna. Si los tiempos de lectura de los datos almacenados en columnas son lo suficientemente rápidos, se pueden realizar vistas consolidadas de los datos sobre la marcha , eliminando la necesidad de mantener vistas agregadas y su redundancia de datos asociada . [33]
Aunque tradicionalmente se han preferido los sistemas orientados a filas para OLTP , el almacenamiento en memoria abre técnicas para desarrollar sistemas híbridos adecuados para capacidades tanto OLAP como OLTP , [34] eliminando la necesidad de mantener sistemas separados para operaciones OLTP y OLAP.
El servidor de índice realiza la gestión de sesiones, la autorización, la gestión de transacciones y el procesamiento de comandos. La base de datos tiene un almacén de filas y un almacén de columnas. Los usuarios pueden crear tablas utilizando cualquiera de los dos almacenes, pero el almacén de columnas tiene más capacidades y es el que se utiliza con más frecuencia. [ cita necesaria ] El servidor de índice también gestiona la persistencia entre imágenes de memoria caché de objetos de base de datos, archivos de registro y archivos de almacenamiento permanente. El motor XS permite crear aplicaciones web. [35]
El modelado de información de SAP HANA (también conocido como modelado de datos de SAP HANA) es parte del desarrollo de aplicaciones HANA. El modelado es la metodología para exponer datos operativos al usuario final. En el proceso de modelado se utilizan objetos virtuales reutilizables (llamados vistas de cálculo).
SAP HANA gestiona la concurrencia mediante el uso del control de concurrencia multiversión (MVCC), que proporciona a cada transacción una instantánea de la base de datos en un momento determinado. Cuando una base de datos MVCC necesita actualizar un elemento de datos, no sobrescribirá los datos antiguos con datos nuevos, sino que los marcará como obsoletos y agregará la versión más nueva. [36] [37]
En un entorno escalable , HANA puede mantener volúmenes de hasta un petabyte de datos en la memoria y devolver resultados de consultas en menos de un segundo. Sin embargo, la RAM sigue siendo mucho más cara que el espacio en disco, por lo que el enfoque de escalamiento horizontal sólo es factible para ciertos casos de uso en los que el tiempo es crítico. [38]
SAP HANA incluye varios motores analíticos para diversos tipos de procesamiento de datos. La Biblioteca de funciones empresariales incluye una serie de algoritmos disponibles para abordar algoritmos comunes de procesamiento de datos empresariales, como la depreciación de activos , el pronóstico móvil y la media móvil . [39] La biblioteca de análisis predictivo incluye algoritmos nativos para calcular medidas estadísticas comunes en áreas como agrupación , clasificación y análisis de series de tiempo . [40]
HANA incorpora el lenguaje de programación estadística de código abierto R como lenguaje compatible dentro de los procedimientos almacenados . [41]
La base de datos de almacén de columnas ofrece capacidades de base de datos de gráficos . El motor de gráficos procesa Cypher Query Language y también tiene una manipulación visual de gráficos a través de una herramienta llamada Graph Viewer. Las estructuras de datos de gráficos se almacenan directamente en tablas relacionales en el almacén de columnas de HANA. [42] Los algoritmos prediseñados en el motor de gráficos incluyen coincidencia de patrones, búsqueda de vecindad, ruta única más corta y componentes fuertemente conectados. Las situaciones de uso típicas de Graph Engine incluyen ejemplos como trazabilidad de la cadena de suministro, detección de fraude y logística y planificación de rutas. [43]
HANA también incluye un motor de base de datos espacial que implementa tipos de datos espaciales y extensiones SQL para operaciones CRUD en datos espaciales. HANA está certificado por el Open Geospatial Consortium , [44] y se integra con el sistema de información geográfica ArcGIS de ESRI . [45]
Además de los algoritmos numéricos y estadísticos, HANA puede realizar análisis de texto y búsqueda de texto empresarial. La capacidad de búsqueda de HANA se basa en una búsqueda “difusa” tolerante a fallas, muy parecida a los motores de búsqueda modernos basados en la web. Los resultados incluyen una medida estadística de cuán relevantes son los resultados de la búsqueda y los criterios de búsqueda pueden incluir un umbral de precisión para los resultados. [46] Los análisis disponibles incluyen la identificación de entidades como personas, fechas, lugares, organizaciones, solicitudes, problemas y más. Dicha extracción de entidades puede atenderse a casos de uso específicos como Voz del Cliente (preferencias y expectativas del cliente), Empresa (es decir, fusiones y adquisiciones, productos, organizaciones) y Sector Público (personas públicas, eventos, organizaciones). [47] También se pueden implementar diccionarios y extracciones personalizadas.
Además de las capacidades de base de datos y análisis de datos, SAP HANA es un servidor de aplicaciones basado en web que aloja aplicaciones orientadas al usuario estrechamente integradas con la base de datos y los motores de análisis de HANA. El "XS Advanced Engine" (XSA) funciona de forma nativa con los lenguajes y tiempos de ejecución Node.js y JavaEE . XSA se basa en la arquitectura Cloud Foundry y, por lo tanto, respalda la noción de "Traiga su propio idioma", lo que permite a los desarrolladores desarrollar e implementar aplicaciones escritas en lenguajes y tiempos de ejecución distintos a los que XSA implementa de forma nativa, así como implementar aplicaciones como microservicios . XSA también permite JavaScript del lado del servidor con SAP HANA XS Javascript (XSJS). [48]
El servidor de aplicaciones admite un conjunto de herramientas de gestión del ciclo de vida de las aplicaciones que permiten la implementación del desarrollo y la supervisión de aplicaciones orientadas al usuario.
HANA se puede implementar localmente o en la nube desde varios proveedores de servicios en la nube . [49]
HANA se puede implementar localmente como un nuevo dispositivo de un proveedor de hardware certificado. [50] Alternativamente, los componentes de hardware existentes, como el almacenamiento y la red, se pueden utilizar como parte de la implementación, un enfoque que SAP llama "Integración personalizada del centro de datos (TDI)". [51] [52] HANA está certificado para ejecutarse en múltiples sistemas operativos [53] , incluidos SUSE Linux Enterprise Server [54] y Red Hat Enterprise Linux . [55] Las plataformas de hardware compatibles para la implementación local incluyen Intel 64 [56] y POWER Systems . [57] El sistema está diseñado para admitir escalamiento tanto horizontal como vertical .
Múltiples proveedores de nube ofrecen SAP HANA sobre una base de infraestructura como servicio , que incluye:
SAP también ofrece sus propios servicios en la nube en forma de:
Las licencias de SAP HANA se dividen principalmente en dos categorías. [sesenta y cinco]
Licencia de tiempo de ejecución:
Se utiliza para ejecutar aplicaciones SAP como SAP Business Warehouse con tecnología de SAP HANA y SAP S/4HANA .
Licencia de uso completo:
Se utiliza para ejecutar aplicaciones SAP y no SAP. Esta licencia se puede utilizar para crear aplicaciones personalizadas. [66]
Como parte de la licencia de uso completo, las funciones se agrupan en ediciones dirigidas a diversos casos de uso.
Además, se licencian capacidades como streaming y ETL como opciones adicionales. [67]
A partir del 9 de marzo de 2017, SAP HANA está disponible en una edición Express ; una versión optimizada que puede ejecutarse en computadoras portátiles y otros entornos con recursos limitados. La licencia de SAP HANA, edición express es gratuita, incluso para uso productivo hasta 32 GB de RAM. [68] Se pueden adquirir aumentos de capacidad adicionales hasta 128 GB de RAM. [69]