Apache CarbonData es un formato de almacenamiento de datos en columnas gratuito y de código abierto del ecosistema Apache Hadoop . Es similar a otros formatos de archivos de almacenamiento en columnas disponibles en Hadoop, a saber, RCFile y ORC . Es compatible con la mayoría de los marcos de procesamiento de datos en el entorno Hadoop . Proporciona esquemas de codificación y compresión de datos eficientes con un rendimiento mejorado para manejar datos complejos en masa.
CarbonData fue desarrollado en Huawei en 2013. [3] [4] El proyecto fue donado a la Comunidad Apache en 2015 y enviado a la Incubadora Apache en junio de 2016. [3] [4] El proyecto ganó los máximos honores en la categoría Big Data de los Novatos del Año de Código Abierto de BlackDuck 2016. [5] Apache CarbonData ha sido un proyecto de alto nivel patrocinado por la Apache Software Foundation (ASF) desde el 1 de mayo de 2017. [1]