Sistema de archivos Cassandra

El sistema de archivos Cassandra, más conocido como CFS, es un sistema de archivos distribuido compatible con Hadoop Data File System (HDFS) y desarrollado por DataStax, Inc.

DataStax creo este sistema de archios distribuido para que trabajara en conjunto con sus aplicaciones y Cassandra la cual es una base de datos distribuida NoSQL.

Posteriormente se ejecuta “dfs.block.size” por cada dato y, mientras se hace la lectura de los datos, los datos se van dividiendo en sub bloques con tamaños que se obtienen de la función “cfs.local.subblock.size”, estos sub bloques generados se comprimen para que cada bloque tenga escrito su ID en "inode", mientras que los bloques secundarios se escriben en Cassandra con su respectivo ID, donde la llave de la fila será el ID del bloque y los ID de los sub bloques como llaves de columna.

Debido a que Cassandra no fue diseñada para almacenar grandes cantidades de datos binarios como una celda individual, los archivos en CFS se tienen que dividir en bloques y sub-bloques donde cada uno es de 2MB por default.

CFS ha quedado en desuso y se reemplazó con un sistema de archivos DataStax Enterprise (DSEFS).