En el procesamiento de imágenes , la normalización es un proceso que cambia el rango de valores de intensidad de píxeles . Las aplicaciones incluyen fotografías con poco contraste debido al deslumbramiento, por ejemplo. La normalización a veces se denomina estiramiento del contraste o estiramiento del histograma . En campos más generales del procesamiento de datos, como el procesamiento de señales digitales , se lo conoce como expansión del rango dinámico . [1]
El propósito de la expansión del rango dinámico en las diversas aplicaciones es generalmente llevar la imagen, u otro tipo de señal, a un rango que sea más familiar o normal para los sentidos, de ahí el término normalización. A menudo, la motivación es lograr consistencia en el rango dinámico para un conjunto de datos, señales o imágenes para evitar distracciones o fatiga mental. Por ejemplo, un periódico se esforzará por hacer que todas las imágenes de una edición compartan un rango similar de escala de grises .
La normalización transforma una imagen en escala de grises n-dimensional con valores de intensidad en el rango , en una nueva imagen con valores de intensidad en el rango .
La normalización lineal de una imagen digital en escala de grises se realiza según la fórmula
Por ejemplo, si el rango de intensidad de la imagen es de 50 a 180 y el rango deseado es de 0 a 255, el proceso implica restar 50 de la intensidad de cada píxel, lo que da como resultado un rango de 0 a 130. Luego, la intensidad de cada píxel se multiplica por 255/130, lo que da como resultado un rango de 0 a 255.
La normalización también puede ser no lineal, esto sucede cuando no hay una relación lineal entre y . Un ejemplo de normalización no lineal es cuando la normalización sigue una función sigmoidea , en ese caso, la imagen normalizada se calcula de acuerdo con la fórmula
Donde define el ancho del rango de intensidad de entrada y define la intensidad alrededor de la cual se centra el rango. [2]
La normalización automática en el software de procesamiento de imágenes generalmente normaliza todo el rango dinámico del sistema numérico especificado en el formato del archivo de imagen.
Esta es la técnica más importante y esencial de mejora de imágenes basada en el espacio. [3] El objetivo básico de la técnica de mejora del contraste es ajustar el contraste local en la imagen para resaltar las regiones u objetos claros en la imagen. Las imágenes de bajo contraste a menudo son el resultado de condiciones de iluminación deficientes o no uniformes, un rango dinámico limitado del sensor de imágenes o configuraciones incorrectas de la apertura de la lente.
La mejora del contraste intenta cambiar la intensidad del píxel en la imagen, particularmente en la imagen de entrada con el fin de obtener una imagen más mejorada. Se basa en una serie de técnicas, a saber, niveles de contraste local, global, oscuro y brillante. La mejora del contraste se considera como la cantidad de diferenciación de color o gris que se encuentra entre las diferentes características de una imagen. La mejora del contraste mejora la calidad de la imagen al aumentar la diferencia de luminancia entre el primer plano y los fondos.
Una transformación de estiramiento por contraste se puede lograr mediante:
1. Ampliar el rango oscuro de valores de entrada a un rango más amplio de valores de salida: esto implica aumentar el brillo de las áreas más oscuras de la imagen para mejorar los detalles y la visibilidad.
2. Cambiar el rango medio de los valores de entrada: esto implica ajustar los niveles de brillo de los tonos medios en la imagen para mejorar el contraste y la claridad generales.
3. Comprimir el rango brillante de valores de entrada: este proceso implica reducir el brillo de las áreas más brillantes de la imagen para evitar la sobreexposición, dando como resultado una imagen más equilibrada y visualmente atractiva.
El estiramiento de contraste local (LCS) es un método de mejora de imágenes que se centra en ajustar localmente el valor de cada píxel para mejorar la visualización de las estructuras dentro de una imagen, en particular en las partes más oscuras y más claras. Funciona mediante el uso de ventanas deslizantes, conocidas como núcleos , que recorren la imagen. El píxel central dentro de cada núcleo se ajusta utilizando la siguiente fórmula:
Dónde: I p ( x , y ) es el nivel de color para el píxel de salida (x,y) después del proceso de estiramiento de contraste.
I 0 ( x , y ) es la entrada de nivel de color para el píxel de datos (x, y).
max es el valor máximo para el nivel de color en la imagen de entrada dentro del kernel seleccionado.
min es el valor mínimo para el nivel de color en la imagen de entrada dentro del kernel seleccionado. [4]
El estiramiento del contraste local considera cada rango de paleta de colores en la imagen (R, G y B) por separado, proporcionando un conjunto de valores mínimos y máximos para cada paleta de colores.
Por otro lado, el estiramiento de contraste global considera todos los rangos de paletas de colores a la vez para determinar los valores máximos y mínimos para toda la imagen en color RGB. Este enfoque utiliza la combinación de colores RGB para derivar un único valor máximo y mínimo para el estiramiento de contraste en toda la imagen.
Estas técnicas de estiramiento del contraste juegan un papel crucial en la mejora de la claridad y visibilidad de las estructuras dentro de las imágenes, particularmente en escenarios con bajo contraste resultante de factores como condiciones de iluminación no uniformes o rango dinámico limitado.