El recuento de cajas es un método de recopilación de datos para analizar patrones complejos dividiendo un conjunto de datos , un objeto, una imagen, etc. en piezas cada vez más pequeñas, normalmente en forma de "caja", y analizando las piezas en cada escala más pequeña. La esencia del proceso se ha comparado con acercar o alejar el zoom utilizando métodos ópticos o informáticos para examinar cómo las observaciones de detalle cambian con la escala. Sin embargo, al contar cajas, en lugar de cambiar el aumento o la resolución de una lente, el investigador cambia el tamaño del elemento utilizado para inspeccionar el objeto o patrón (ver Figura 1). Se han aplicado algoritmos de conteo de cajas por computadora a patrones en espacios de 1, 2 y 3 dimensiones. [1] [2] La técnica generalmente se implementa en software para su uso en patrones extraídos de medios digitales , aunque el método fundamental se puede utilizar para investigar algunos patrones físicamente. La técnica surgió y se utiliza en el análisis fractal . También tiene aplicación en campos relacionados como lacunaridad y análisis multifractal . [3] [4]
Teóricamente, la intención del recuento de cajas es cuantificar la escala fractal , pero desde una perspectiva práctica esto requeriría que la escala se conociera de antemano. Esto se puede ver en la Figura 1, donde la elección de cajas de los tamaños relativos correctos muestra fácilmente cómo el patrón se repite en escalas más pequeñas. Sin embargo, en el análisis fractal, el factor de escala no siempre se conoce de antemano, por lo que los algoritmos de conteo de cajas intentan encontrar una forma optimizada de cortar un patrón que revele el factor de escala. El método fundamental para hacer esto comienza con un conjunto de elementos de medición ( cajas) que consta de un número arbitrario, llamado aquí por conveniencia, de tamaños o calibres, al que llamaremos conjunto de s. Luego, estas cajas de tamaño grande se aplican al patrón y se cuentan. Para hacer esto, para cada uno de ellos , se utiliza un elemento de medición que normalmente es un cuadrado bidimensional o una caja tridimensional con una longitud lateral correspondiente a para escanear un patrón o conjunto de datos (por ejemplo, una imagen u objeto) de acuerdo con un patrón predeterminado. plan de escaneo para cubrir la parte relevante del conjunto de datos, registrando, es decir, contando , para cada paso del escaneo las características relevantes capturadas dentro del elemento de medición. [3] [4]
Las características relevantes recopiladas durante el recuento de cajas dependen del tema que se investiga y del tipo de análisis que se realiza. Dos temas bien estudiados del conteo de cajas, por ejemplo, son las imágenes digitales binarias (es decir, tener sólo dos colores, generalmente blanco y negro) [2] y en escala de grises [5] (es decir, jpegs, tiffs, etc.). El recuento de cajas se realiza generalmente sobre patrones extraídos de tales imágenes fijas, en cuyo caso la información sin procesar registrada se basa típicamente en características de píxeles tales como un valor de color predeterminado o una gama de colores o intensidades. Cuando se realiza el recuento de cajas para determinar una dimensión fractal conocida como dimensión de recuento de cajas , la información registrada suele ser sí o no en cuanto a si la caja contenía píxeles del color o rango predeterminado (es decir, el número de cajas que contienen se cuentan los píxeles relevantes en cada uno ). Para otros tipos de análisis, los datos buscados pueden ser el número de píxeles que se encuentran dentro del cuadro de medición, [4] el rango o valores promedio de colores o intensidades, la disposición espacial entre los píxeles dentro de cada cuadro o propiedades como la velocidad promedio. (por ejemplo, del flujo de partículas). [5] [6] [7] [8]
Cada algoritmo de conteo de cajas tiene un plan de escaneo que describe cómo se recopilarán los datos; en esencia, cómo se moverá la caja sobre el espacio que contiene el patrón. Se ha utilizado una variedad de estrategias de escaneo en los algoritmos de conteo de cajas, donde se han modificado algunos enfoques básicos para abordar cuestiones como el muestreo, los métodos de análisis, etc.
El enfoque tradicional es escanear en una cuadrícula o patrón de celosía regular que no se superponga. [3] [4] A modo de ilustración, la Figura 2a muestra el patrón típico utilizado en el software que calcula las dimensiones de conteo de cajas a partir de patrones extraídos en imágenes digitales binarias de contornos como el contorno fractal ilustrado en la Figura 1 o el ejemplo clásico de la costa de Gran Bretaña. Se utiliza a menudo para explicar el método para encontrar una dimensión de conteo de cajas . La estrategia simula la colocación repetida de un cuadro cuadrado como si fuera parte de una cuadrícula superpuesta a la imagen, de modo que el cuadro de cada uno nunca se superponga donde estaba anteriormente (consulte la Figura 4). Esto se hace hasta que se haya escaneado toda el área de interés utilizando cada uno y se haya registrado la información relevante. [9] [10] Cuando se utiliza para encontrar una dimensión de conteo de cajas , el método se modifica para encontrar una cobertura óptima.
Otro enfoque que se ha utilizado es un algoritmo de cuadro deslizante, en el que cada cuadro se desliza sobre la imagen superponiéndose a la ubicación anterior. La Figura 2b ilustra el patrón básico de escaneo usando una caja deslizante. El enfoque de cuadrícula fija puede verse como un algoritmo de caja deslizante con incrementos horizontales y verticales iguales a . Los algoritmos de caja deslizante se utilizan a menudo para analizar texturas en análisis de lacunaridad y también se han aplicado al análisis multifractal . [2] [8] [11] [12] [13]
El recuento de cajas también se puede utilizar para determinar la variación local en lugar de medidas globales que describen un patrón completo. La variación local se puede evaluar después de que los datos han sido recopilados y analizados (por ejemplo, algunos software codifican las áreas con colores según la dimensión fractal de cada submuestra), pero un tercer método para contar cajas es mover la caja de acuerdo con alguna característica relacionada con la muestra. píxeles de interés. En los algoritmos de conteo de cuadros de dimensiones conectadas locales, por ejemplo, el cuadro de cada uno está centrado en cada píxel de interés, como se ilustra en la Figura 2c. [7]
La implementación de cualquier algoritmo de conteo de cajas debe especificar ciertos detalles, como cómo determinar los valores reales en , incluidos los tamaños mínimo y máximo a usar y el método de incremento entre tamaños. Muchos de estos detalles reflejan cuestiones prácticas como el tamaño de una imagen digital, pero también cuestiones técnicas relacionadas con el análisis específico que se realizará con los datos.Otro tema que ha recibido considerable atención es cómo aproximar la llamada "cobertura óptima" para determinar las dimensiones de conteo de cajas y evaluar la escala multifractal . [5] [14] [15] [16]
Un problema conocido a este respecto es decidir cuál constituye el borde de la información útil en una imagen digital, ya que los límites empleados en la estrategia de conteo de cajas pueden afectar los datos recopilados.
El algoritmo tiene que especificar el tipo de incremento que se utilizará entre los tamaños de cuadro (por ejemplo, lineal frente a exponencial), lo que puede tener un efecto profundo en los resultados de un escaneo.
Como ilustra la Figura 4, la posición general de las cajas también influye en los resultados del recuento de cajas. Un enfoque a este respecto es escanear desde múltiples orientaciones y utilizar datos promediados u optimizados. [17] [18]
Para abordar diversas consideraciones metodológicas, algunos programas están escritos para que los usuarios puedan especificar muchos de esos detalles, y algunos incluyen métodos como suavizar los datos después del hecho para que sean más adaptables al tipo de análisis que se realiza. [19]