HBase es una base de datos distribuida no relacional de código abierto modelada a partir de Bigtable de Google y escrita en Java . Se desarrolla como parte del proyecto Apache Hadoop de Apache Software Foundation y se ejecuta sobre HDFS (Hadoop Distributed File System) o Alluxio , proporcionando capacidades similares a las de Bigtable para Hadoop. Es decir, proporciona una forma tolerante a errores de almacenar grandes cantidades de datos dispersos (pequeñas cantidades de información atrapadas dentro de una gran colección de datos vacíos o sin importancia, como encontrar los 50 elementos más grandes en un grupo de 2 mil millones de registros, o encontrar los elementos distintos de cero representan menos del 0,1% de una gran colección).
HBase presenta compresión, operación en memoria y filtros Bloom por columna, como se describe en el documento original de Bigtable. [2] Las tablas en HBase pueden servir como entrada y salida para trabajos de MapReduce que se ejecutan en Hadoop, y se puede acceder a ellas a través de la API de Java, pero también a través de las API de puerta de enlace REST , Avro o Thrift . HBase es un almacén de columnas anchas y ha sido ampliamente adoptado debido a su linaje con Hadoop y HDFS. HBase se ejecuta sobre HDFS y es ideal para operaciones rápidas de lectura y escritura en grandes conjuntos de datos con alto rendimiento y baja latencia de entrada/salida.
HBase no es un reemplazo directo de una base de datos SQL clásica ; sin embargo, el proyecto Apache Phoenix proporciona una capa SQL para HBase, así como un controlador JDBC que se puede integrar con varias aplicaciones de análisis e inteligencia empresarial . El proyecto Apache Trafodion proporciona un motor de consultas SQL con controladores ODBC y JDBC y protección de transacciones ACID distribuida en múltiples declaraciones, tablas y filas que utilizan HBase como motor de almacenamiento.
HBase ahora presta servicios a varios sitios web basados en datos [3] , pero la plataforma de mensajería de Facebook migró de HBase a MyRocks en 2018. [4] [5] A diferencia de las bases de datos relacionales y tradicionales, HBase no admite secuencias de comandos SQL; en cambio, el equivalente está escrito en Java, empleando similitud con una aplicación MapReduce.
En el lenguaje del teorema CAP de Eric Brewer , HBase es un sistema de tipo CP.
Apache HBase comenzó como un proyecto de la empresa Powerset debido a la necesidad de procesar cantidades masivas de datos con fines de búsqueda en lenguaje natural . Desde 2010 es un proyecto Apache de primer nivel.
Facebook eligió implementar su nueva plataforma de mensajería utilizando HBase en noviembre de 2010, pero abandonó HBase en 2018. [4]
La serie 2.4.x es la línea de versión estable actual y reemplaza las líneas de versión anteriores.
La siguiente es una lista de empresas destacadas que han utilizado o están utilizando HBase:
{{cite web}}
: |first=
tiene nombre genérico ( ayuda )