stringtranslate.com

ApacheHBase

HBase es una base de datos distribuida no relacional de código abierto modelada a partir de Bigtable de Google y escrita en Java . Se desarrolla como parte del proyecto Apache Hadoop de Apache Software Foundation y se ejecuta sobre HDFS (Hadoop Distributed File System) o Alluxio , proporcionando capacidades similares a las de Bigtable para Hadoop. Es decir, proporciona una forma tolerante a errores de almacenar grandes cantidades de datos dispersos (pequeñas cantidades de información atrapadas dentro de una gran colección de datos vacíos o sin importancia, como encontrar los 50 elementos más grandes en un grupo de 2 mil millones de registros, o encontrar los elementos distintos de cero representan menos del 0,1% de una gran colección).

HBase presenta compresión, operación en memoria y filtros Bloom por columna, como se describe en el documento original de Bigtable. [2] Las tablas en HBase pueden servir como entrada y salida para trabajos de MapReduce que se ejecutan en Hadoop, y se puede acceder a ellas a través de la API de Java, pero también a través de las API de puerta de enlace REST , Avro o Thrift . HBase es un almacén de columnas anchas y ha sido ampliamente adoptado debido a su linaje con Hadoop y HDFS. HBase se ejecuta sobre HDFS y es ideal para operaciones rápidas de lectura y escritura en grandes conjuntos de datos con alto rendimiento y baja latencia de entrada/salida.

HBase no es un reemplazo directo de una base de datos SQL clásica ; sin embargo, el proyecto Apache Phoenix proporciona una capa SQL para HBase, así como un controlador JDBC que se puede integrar con varias aplicaciones de análisis e inteligencia empresarial . El proyecto Apache Trafodion proporciona un motor de consultas SQL con controladores ODBC y JDBC y protección de transacciones ACID distribuida en múltiples declaraciones, tablas y filas que utilizan HBase como motor de almacenamiento.

HBase ahora presta servicios a varios sitios web basados ​​en datos [3] , pero la plataforma de mensajería de Facebook migró de HBase a MyRocks en 2018. [4] [5] A diferencia de las bases de datos relacionales y tradicionales, HBase no admite secuencias de comandos SQL; en cambio, el equivalente está escrito en Java, empleando similitud con una aplicación MapReduce.

En el lenguaje del teorema CAP de Eric Brewer , HBase es un sistema de tipo CP.

Historia

Apache HBase comenzó como un proyecto de la empresa Powerset debido a la necesidad de procesar cantidades masivas de datos con fines de búsqueda en lenguaje natural . Desde 2010 es un proyecto Apache de primer nivel.

Facebook eligió implementar su nueva plataforma de mensajería utilizando HBase en noviembre de 2010, pero abandonó HBase en 2018. [4]

La serie 2.4.x es la línea de versión estable actual y reemplaza las líneas de versión anteriores.

Casos de uso e implementaciones de producción

Empresas que utilizan HBase

La siguiente es una lista de empresas destacadas que han utilizado o están utilizando HBase:

Ver también

Referencias

  1. ^ abc "Apache HBase - Descargas de Apache HBase" . Consultado el 27 de septiembre de 2022 .
  2. ^ Chang, et al. (2006). Bigtable: un sistema de almacenamiento distribuido para datos estructurados
  3. ^ "Apache HBase: con tecnología de Apache HBase". hbase.apache.org . Consultado el 8 de abril de 2018 .
  4. ^ ab "Migración del almacenamiento de Messenger para optimizar el rendimiento". www.facebook.com . 26 de junio de 2018 . Consultado el 5 de julio de 2018 .
  5. ^ Facebook: Por qué nuestras comunicaciones de 'próxima generación' abandonaron MySQL Consultado el 17 de diciembre de 2010.
  6. ^ HBaseCon (2 de agosto de 2016). "Apache HBase en Airbnb". slideshare.net . Consultado el 8 de abril de 2018 .
  7. ^ "Indexación de búsqueda casi en tiempo real".
  8. ^ "¿La localidad de los datos está siempre lista para usar en Hadoop?".
  9. ^ "Por qué Imgur abandonó MySQL en favor de HBase - Base de datos DZone". dzone.com . Consultado el 8 de abril de 2018 .
  10. ^ "Martes tecnológico: Notificaciones de Imgur: de MySQL a HBase - El blog de Imgur". blog.imgur.com . Consultado el 8 de abril de 2018 .
  11. ^ Doyung Yoon. "S2Graph: una base de datos de gráficos a gran escala con HBase".
  12. ^ Parque Cheolsoo y Ashwin Shankar. "Netflix: integración de Spark a escala de petabytes".
  13. ^ Ingeniería, Pinterest (30 de marzo de 2018). "Mejora de la eficiencia de la copia de seguridad de HBase en Pinterest". Medio . Consultado el 14 de abril de 2020 . {{cite web}}: |first=tiene nombre genérico ( ayuda )
  14. ^ "Hbase en Salesforce.com".
  15. ^ Josh Baer. "Cómo Apache impulsa las recomendaciones musicales de Spotify".
  16. ^ "Chat grupal de Tuenti: simple pero complejo". Archivado desde el original el 24 de noviembre de 2012 . Consultado el 29 de septiembre de 2015 .
  17. ^ "Tuenti Asincrónico". GitHub . 6 de noviembre de 2013.

Bibliografía

enlaces externos