Los métodos de umbralización más simples reemplazan cada píxel de una imagen con un píxel negro si la intensidad de la imagen es menor que un valor fijo llamado umbral , o con un píxel blanco si la intensidad del píxel es mayor que ese umbral. En la imagen de ejemplo de la derecha, esto da como resultado que el árbol oscuro se vuelva completamente negro y la nieve brillante se vuelva completamente blanca.
Umbral automático
Si bien en algunos casos el usuario puede seleccionar manualmente el umbral , hay muchos casos en los que el usuario desea que el umbral se establezca automáticamente mediante un algoritmo. En esos casos, el umbral debe ser el "mejor" umbral en el sentido de que la partición de los píxeles por encima y por debajo del umbral debe coincidir lo más posible con la partición real entre las dos clases de objetos representados por esos píxeles (por ejemplo, los píxeles por debajo del umbral deben corresponder al fondo y los que están por encima a algunos objetos de interés en la imagen).
Existen muchos tipos de métodos de umbralización automática, siendo el más famoso y ampliamente utilizado el método de Otsu . Sezgin et al. 2004 categorizó los métodos de umbralización en grupos amplios según la información que manipula el algoritmo. [2] Sin embargo, cabe señalar que dicha categorización es necesariamente imprecisa, ya que algunos métodos pueden caer en varias categorías (por ejemplo, el método de Otsu puede considerarse tanto un algoritmo de forma de histograma como un algoritmo de agrupamiento).
Métodos basados en la forma del histograma , donde, por ejemplo, se analizan los picos, valles y curvaturas del histograma suavizado. [3] Nótese que estos métodos, más que otros, hacen ciertas suposiciones sobre la distribución de probabilidad de intensidad de la imagen (es decir, la forma del histograma),
Métodos basados en agrupamiento , donde las muestras de nivel de gris se agrupan en dos partes como fondo y primer plano, [4] [5]
Los métodos basados en la entropía dan como resultado algoritmos que utilizan la entropía de las regiones de primer plano y de fondo, la entropía cruzada entre la imagen original y la binarizada, etc. [6].
Los métodos basados en atributos de objeto buscan una medida de similitud entre las imágenes en nivel de gris y las imágenes binarizadas, como similitud de formas difusas, coincidencia de bordes, etc.
Los métodos espaciales utilizan una distribución de probabilidad de orden superior y/o correlación entre píxeles.
Umbral global vs. umbral local
En la mayoría de los métodos, se aplica el mismo umbral a todos los píxeles de una imagen. Sin embargo, en algunos casos, puede ser ventajoso aplicar un umbral diferente a diferentes partes de la imagen, en función del valor local de los píxeles. Esta categoría de métodos se denomina umbralización local o adaptativa. Se adaptan especialmente a los casos en los que las imágenes tienen una iluminación no homogénea, como en la imagen del sudoku de la derecha. En esos casos, se define un vecindario y se calcula un umbral para cada píxel y su vecindario. Muchos métodos de umbralización global se pueden adaptar para que funcionen de forma local, pero también hay métodos desarrollados específicamente para el umbralización local, como los algoritmos Niblack [7] o Bernsen.
Software como ImageJ propone una amplia gama de métodos de umbral automático, tanto globales como locales.
Ventajas del umbral local frente al umbral global[8]
Adaptabilidad a las características locales de la imagen: el umbral local puede adaptarse a las variaciones de iluminación, contraste y textura en diferentes partes de la imagen. Esta adaptabilidad ayuda a manejar imágenes con condiciones de iluminación no uniformes o texturas complejas.
Preservación de detalles locales: al aplicar umbrales personalizados a diferentes regiones, el umbralizado local puede preservar detalles finos y bordes que podrían perderse en el umbralizado global, especialmente en áreas con intensidades o gradientes variables.
Sensibilidad reducida al ruido: el umbral local puede ser menos sensible al ruido en comparación con el umbral global, ya que la decisión de umbral se basa en estadísticas locales en lugar de en la imagen completa.
Ejemplos de algoritmos para umbralización local
Método de Niblack: [9] El algoritmo de Niblack calcula un umbral local para cada píxel basándose en la media y la desviación estándar de la vecindad del píxel. Ajusta el umbral en función de las características locales de la imagen, lo que lo hace adecuado para manejar variaciones en la iluminación.
Método de Bernsen: [10] El algoritmo de Bernsen calcula el umbral para cada píxel teniendo en cuenta el contraste local dentro de un entorno. Utiliza un tamaño de ventana fijo y es resistente al ruido y a las variaciones en la intensidad del fondo.
Método de Sauvola: [11] El algoritmo de Sauvola extiende el método de Niblack incorporando un factor dinámico que adapta el umbral en función del contraste local y la intensidad media. Este factor adaptativo mejora los resultados de binarización, en particular en regiones con contrastes variables.
Extensiones del umbral binario
Imágenes multibanda
Las imágenes en color también pueden tener umbrales. Un enfoque consiste en designar un umbral independiente para cada uno de los componentes RGB de la imagen y luego combinarlos con una operación AND . Esto refleja la forma en que funciona la cámara y cómo se almacenan los datos en la computadora, pero no se corresponde con la forma en que las personas reconocen el color. Por lo tanto, los modelos de color HSL y HSV se utilizan con más frecuencia; tenga en cuenta que, dado que el tono es una cantidad circular, requiere un umbral circular . También es posible utilizar el modelo de color CMYK . [12]
Umbrales múltiples
En lugar de un único umbral que dé como resultado una imagen binaria, también es posible introducir múltiples umbrales crecientes . En ese caso, la implementación de umbrales dará como resultado una imagen con clases, donde los píxeles con una intensidad tal que se asignarán a la clase . La mayoría de los métodos de umbralización automática binaria tienen una extensión natural para la umbralización múltiple.
Limitaciones
La umbralización funcionará mejor en determinadas condiciones:
bajo nivel de ruido
mayor varianza intraclase que varianza interclase, es decir, los píxeles de un mismo grupo tienen intensidades más cercanas entre sí que los píxeles de otro grupo,
^ Shapiro, Linda G.; Stockman, George C. (2001). Visión artificial . Prentice Hall. pág. 83. ISBN 978-0-13-030796-5.
^ Sankur, Bülent (2004). "Estudio sobre técnicas de umbralización de imágenes y evaluación cuantitativa del rendimiento". Journal of Electronic Imaging . 13 (1): 146. Bibcode :2004JEI....13..146S. doi :10.1117/1.1631315.
^ Zack, GW; Rogers, WE; Latt, SA (julio de 1977). "Medición automática de la frecuencia de intercambio de cromátidas hermanas". Journal of Histochemistry & Cytochemistry . 25 (7): 741–753. doi : 10.1177/25.7.70454 . PMID 70454. S2CID 15339151.
^ "Umbralización de imágenes mediante un método de selección iterativo". IEEE Transactions on Systems, Man, and Cybernetics . 8 (8): 630–632. 1978. doi :10.1109/TSMC.1978.4310039.
^ Barghout, L.; Sheynin, J. (25 de julio de 2013). "Percepción de escenas del mundo real y organización perceptual: lecciones de la visión artificial". Journal of Vision . 13 (9): 709. doi : 10.1167/13.9.709 .
^ Kapur, JN; Sahoo, PK; Wong, AKC (1 de marzo de 1985). "Un nuevo método para el umbral de imágenes en niveles de gris utilizando la entropía del histograma". Visión artificial, gráficos y procesamiento de imágenes . 29 (3): 273–285. doi :10.1016/0734-189X(85)90125-2.
^ Zhou, Huiyu., Wu, Jiahua., Zhang, Jianguo. Procesamiento de imágenes digitales: Parte II. Estados Unidos: Ventus Publishing, 2010. [ página necesaria ]
^ Niblack, Wayne (1986). Introducción al procesamiento de imágenes digitales . Prentice-Hall International. ISBN0-13-480600-X.OCLC 1244113797 .[ página necesaria ]
^ Chaki, Nabendu., Shaikh, Soharab Hossain., Saeed, Khalid. Explorando técnicas de binarización de imágenes. Alemania: Springer India, 2014. [ página necesaria ]
^ Sauvola, J.; Pietikäinen, M. (febrero de 2000). "Binarización adaptativa de imágenes de documentos". Reconocimiento de patrones . 33 (2): 225–236. Código Bibliográfico :2000PatRe..33..225S. doi :10.1016/S0031-3203(99)00055-2.
^ Pham, Nhu-An; Morrison, Andrew; Schwock, Joerg; Aviel-Ronen, Sarit; Iakovlev, Vladimir; Tsao, Ming-Sound; Ho, James; Hedley, David W. (27 de febrero de 2007). "Análisis cuantitativo de imágenes de tinciones inmunohistoquímicas utilizando un modelo de color CMYK". Patología diagnóstica . 2 (1): 8. doi : 10.1186/1746-1596-2-8 . PMC 1810239 . PMID 17326824.
Lectura adicional
Gonzalez, Rafael C. y Woods, Richard E. (2002). Thresholding. En Procesamiento de imágenes digitales, págs. 595-611. Pearson Education. ISBN 81-7808-629-8
Eichmann, Marco (2009). "Marco para el umbralización eficiente y óptima de imágenes multinivel". Journal of Electronic Imaging . 18 (1): 013004–013004–10. Bibcode :2009JEI....18a3004L. doi :10.1117/1.3073891.
Rosin, Paul L. (marzo de 2014). "Umbralización circular eficiente". IEEE Transactions on Image Processing . 23 (3): 992–1001. Bibcode :2014ITIP...23..992Y. doi :10.1109/TIP.2013.2297014. PMID 24464614.
Scott E. Umbaugh (2018). Procesamiento y análisis de imágenes digitales, págs. 93-96. CRC Press. ISBN 978-1-4987-6602-9