El conteo de cajas es un método de recopilación de datos para analizar patrones complejos mediante la división de un conjunto de datos , objeto, imagen, etc. en piezas cada vez más pequeñas, normalmente con forma de "caja", y el análisis de las piezas en cada escala más pequeña. La esencia del proceso se ha comparado con el acercamiento o alejamiento mediante métodos ópticos o informáticos para examinar cómo cambian las observaciones de detalles con la escala. Sin embargo, en el conteo de cajas, en lugar de cambiar el aumento o la resolución de una lente, el investigador cambia el tamaño del elemento utilizado para inspeccionar el objeto o patrón (véase la Figura 1). Los algoritmos de conteo de cajas basados en ordenador se han aplicado a patrones en espacios unidimensionales, bidimensionales y tridimensionales. [1] [2] La técnica suele implementarse en software para su uso en patrones extraídos de medios digitales , aunque el método fundamental se puede utilizar para investigar algunos patrones físicamente. La técnica surgió y se utiliza en el análisis fractal . También tiene aplicación en campos relacionados, como la lacunaridad y el análisis multifractal . [3] [4]
En teoría, el objetivo del conteo de cajas es cuantificar la escala fractal , pero desde una perspectiva práctica esto requeriría que la escala se conociera de antemano. Esto se puede ver en la Figura 1, donde la elección de cajas de los tamaños relativos correctos muestra fácilmente cómo el patrón se repite a escalas más pequeñas. Sin embargo, en el análisis fractal, el factor de escala no siempre se conoce de antemano, por lo que los algoritmos de conteo de cajas intentan encontrar una forma optimizada de cortar un patrón que revele el factor de escala. El método fundamental para hacer esto comienza con un conjunto de elementos de medición ( cajas) que consisten en un número arbitrario, llamado aquí por conveniencia, de tamaños o calibres, que llamaremos el conjunto de s. Luego, estas cajas de tamaño s se aplican al patrón y se cuentan. Para ello, para cada uno de ellos , se utiliza un elemento de medición que normalmente es un cuadrado bidimensional o una caja tridimensional con una longitud lateral correspondiente a para escanear un patrón o un conjunto de datos (por ejemplo, una imagen u objeto) de acuerdo con un plan de escaneo predeterminado para cubrir la parte relevante del conjunto de datos, registrando, es decir, contando , para cada paso del escaneo las características relevantes capturadas dentro del elemento de medición. [3] [4]
Las características relevantes reunidas durante el conteo de cajas dependen del tema que se investiga y del tipo de análisis que se realiza. Dos temas bien estudiados del conteo de cajas, por ejemplo, son las imágenes digitales binarias (es decir, que tienen solo dos colores, generalmente blanco y negro) [2] y en escala de grises [5] (es decir, jpegs, tiff, etc.). El conteo de cajas generalmente se realiza en patrones extraídos de dichas imágenes fijas, en cuyo caso la información bruta registrada generalmente se basa en características de píxeles, como un valor de color predeterminado o un rango de colores o intensidades. Cuando el conteo de cajas se realiza para determinar una dimensión fractal conocida como la dimensión de conteo de cajas , la información registrada suele ser sí o no en cuanto a si la caja contenía o no píxeles del color o rango predeterminado (es decir, se cuenta el número de cajas que contienen píxeles relevantes en cada una ). Para otros tipos de análisis, los datos buscados pueden ser el número de píxeles que caen dentro del cuadro de medición, [4] el rango o valores promedio de colores o intensidades, la disposición espacial entre píxeles dentro de cada cuadro o propiedades como la velocidad promedio (por ejemplo, del flujo de partículas). [5] [6] [7] [8]
Cada algoritmo de conteo de cajas tiene un plan de escaneo que describe cómo se recopilarán los datos; en esencia, cómo se moverá la caja sobre el espacio que contiene el patrón. Se han utilizado diversas estrategias de escaneo en los algoritmos de conteo de cajas, en los que se han modificado algunos enfoques básicos para abordar cuestiones como el muestreo, los métodos de análisis, etc.
El enfoque tradicional es escanear en una cuadrícula regular no superpuesta o patrón de celosía. [3] [4] Para ilustrar, la Figura 2a muestra el patrón típico utilizado en el software que calcula las dimensiones de conteo de cajas a partir de patrones extraídos en imágenes digitales binarias de contornos como el contorno fractal ilustrado en la Figura 1 o el ejemplo clásico de la costa de Gran Bretaña que se usa a menudo para explicar el método para encontrar una dimensión de conteo de cajas . La estrategia simula la colocación repetida de una caja cuadrada como si fuera parte de una cuadrícula superpuesta a la imagen, de modo que la caja de cada una nunca se superponga donde ha estado anteriormente (ver Figura 4). Esto se hace hasta que se ha escaneado toda el área de interés utilizando cada una y se ha registrado la información relevante. [9] [10] Cuando se utiliza para encontrar una dimensión de conteo de cajas , el método se modifica para encontrar una cobertura óptima.
Otro enfoque que se ha utilizado es un algoritmo de caja deslizante, en el que cada caja se desliza sobre la imagen superponiéndose a la colocación anterior. La figura 2b ilustra el patrón básico de escaneo utilizando una caja deslizante. El enfoque de cuadrícula fija puede verse como un algoritmo de caja deslizante con incrementos horizontales y verticales iguales a . Los algoritmos de caja deslizante se utilizan a menudo para analizar texturas en el análisis de lacunaridad y también se han aplicado al análisis multifractal . [2] [8] [11] [12] [13]
El conteo de cajas también se puede utilizar para determinar la variación local en lugar de las medidas globales que describen un patrón completo. La variación local se puede evaluar después de que se hayan recopilado y analizado los datos (por ejemplo, algunos programas codifican por colores las áreas según la dimensión fractal de cada submuestra), pero un tercer enfoque para el conteo de cajas es mover la caja según alguna característica relacionada con los píxeles de interés. En los algoritmos de conteo de cajas de dimensión conectada local, por ejemplo, la caja de cada uno se centra en cada píxel de interés, como se ilustra en la Figura 2c. [7]
La implementación de cualquier algoritmo de conteo de cajas debe especificar ciertos detalles, como la forma de determinar los valores reales en , incluidos los tamaños mínimo y máximo que se deben utilizar y el método de incremento entre tamaños. Muchos de estos detalles reflejan cuestiones prácticas, como el tamaño de una imagen digital, pero también cuestiones técnicas relacionadas con el análisis específico que se realizará sobre los datos.Otra cuestión que ha recibido considerable atención es cómo aproximar la llamada "cobertura óptima" para determinar las dimensiones de conteo de cajas y evaluar la escala multifractal . [5] [14] [15] [16]
Un problema conocido a este respecto es decidir qué constituye el borde de la información útil en una imagen digital, ya que los límites empleados en la estrategia de conteo de cajas pueden afectar los datos recopilados.
El algoritmo debe especificar el tipo de incremento a utilizar entre los tamaños de los cuadros (por ejemplo, lineal o exponencial), lo que puede tener un efecto profundo en los resultados de un escaneo.
Como ilustra la Figura 4, la posición general de las cajas también influye en los resultados de un recuento de cajas. Un enfoque a este respecto es escanear desde múltiples orientaciones y utilizar datos promediados u optimizados. [17] [18]
Para abordar diversas consideraciones metodológicas, algunos programas están escritos de modo que los usuarios puedan especificar muchos de esos detalles, y algunos incluyen métodos como suavizar los datos después del hecho para que sean más adecuados al tipo de análisis que se está realizando. [19]