stringtranslate.com

Escala de grises

Imagen en escala de grises de un loro

En fotografía digital , imágenes generadas por computadora y colorimetría , una imagen en escala de grises es aquella en la que el valor de cada píxel es una muestra única que representa sólo una cantidad de luz ; es decir, sólo lleva información de intensidad . Las imágenes en escala de grises, una especie de monocromo en blanco y negro o gris , se componen exclusivamente de tonos de gris . El contraste varía desde el negro con la intensidad más débil hasta el blanco con la intensidad más fuerte. [1]

Las imágenes en escala de grises se distinguen de las imágenes bitonales en blanco y negro de un bit, que, en el contexto de las imágenes por computadora, son imágenes con solo dos colores : blanco y negro (también llamadas imágenes binivel o binarias ). Las imágenes en escala de grises tienen muchos tonos de gris intermedios.

Las imágenes en escala de grises pueden ser el resultado de medir la intensidad de la luz en cada píxel de acuerdo con una combinación ponderada particular de frecuencias (o longitudes de onda) y, en tales casos, son monocromáticas cuando solo hay una única frecuencia (en la práctica, una banda estrecha de frecuencias). ) Está capturado. En principio, las frecuencias pueden ser de cualquier parte del espectro electromagnético (por ejemplo, infrarrojo , luz visible , ultravioleta , etc.).

Una imagen colorimétrica (o más específicamente fotométrica ) en escala de grises es una imagen que tiene un espacio de color en escala de grises definido , que asigna los valores de muestra numéricos almacenados al canal acromático de un espacio de color estándar, que a su vez se basa en propiedades medidas de la visión humana .

Si la imagen en color original no tiene un espacio de color definido, o si no se pretende que la imagen en escala de grises tenga la misma intensidad acromática percibida por el ser humano que la imagen en color, entonces no existe una asignación única de dicha imagen en color a una imagen en escala de grises.

Representaciones numéricas

La intensidad de un píxel se expresa dentro de un rango determinado entre un mínimo y un máximo, inclusive. Este rango se representa de forma abstracta como un rango de 0 (o 0%) (ausencia total, negro) y 1 (o 100%) (presencia total, blanco), con cualquier valor fraccionario intermedio. Esta notación se utiliza en artículos académicos, pero no define qué es "negro" o "blanco" en términos de colorimetría . A veces, la escala se invierte, como en la impresión , donde la intensidad numérica indica cuánta tinta se emplea en los medios tonos , siendo el 0% el papel blanco (sin tinta) y el 100% un negro sólido (tinta completa).

En informática, aunque la escala de grises se puede calcular mediante números racionales , los píxeles de la imagen generalmente se cuantifican para almacenarlos como enteros sin signo, para reducir el almacenamiento y el cálculo necesarios. Algunos de los primeros monitores en escala de grises solo podían mostrar hasta dieciséis tonos diferentes, que se almacenarían en forma binaria utilizando 4 bits . [ cita necesaria ] Pero hoy en día las imágenes en escala de grises destinadas a la visualización visual se almacenan comúnmente con 8 bits por píxel muestreado. Esta profundidad de píxel permite registrar 256 intensidades diferentes (es decir, tonos de gris) y también simplifica el cálculo, ya que se puede acceder a cada muestra de píxel individualmente como un byte completo . Sin embargo, si estas intensidades estuvieran espaciadas igualmente en proporción a la cantidad de luz física que representan en ese píxel (llamado codificación lineal o escala), las diferencias entre tonos oscuros adyacentes podrían ser bastante notables como artefactos de bandas , mientras que muchos de los tonos más claros Se "desperdiciaría" codificando una gran cantidad de incrementos perceptivamente indistinguibles. Por lo tanto, las sombras generalmente se distribuyen uniformemente en una escala no lineal comprimida gamma , que se aproxima mejor a los incrementos perceptivos uniformes tanto para las sombras oscuras como para las claras, lo que generalmente hace que estos 256 tonos sean suficientes para evitar incrementos notables. [2]

Los usos técnicos (por ejemplo, en aplicaciones de imágenes médicas o sensores remotos ) a menudo requieren más niveles para aprovechar al máximo la precisión del sensor (normalmente 10 o 12 bits por muestra) y reducir los errores de redondeo en los cálculos. Dieciséis bits por muestra (65.536 niveles) suele ser una opción conveniente para tales usos, ya que las computadoras administran palabras de 16 bits de manera eficiente. Los formatos de archivos de imagen TIFF y PNG (entre otros) admiten de forma nativa la escala de grises de 16 bits, aunque los navegadores y muchos programas de imágenes tienden a ignorar los 8 bits de orden bajo de cada píxel. Internamente, para el cálculo y el almacenamiento de trabajo, el software de procesamiento de imágenes suele utilizar números enteros o de punto flotante de 16 o 32 bits.

Convertir color a escala de grises

Ejemplos de conversión de una imagen a todo color a escala de grises usando el Mezclador de canales de Adobe Photoshop , en comparación con la imagen original y conversión colorimétrica a escala de grises

La conversión de una imagen en color arbitraria a escala de grises no es única en general; La diferente ponderación de los canales de color representa efectivamente el efecto de filmar películas en blanco y negro con filtros fotográficos de diferentes colores en las cámaras.

Conversión colorimétrica (preservación de la luminancia perceptual) a escala de grises

Una estrategia común es utilizar los principios de la fotometría o, más ampliamente, la colorimetría para calcular los valores de la escala de grises (en el espacio de color en escala de grises de destino) para tener la misma luminancia (técnicamente luminancia relativa) que la imagen en color original (según su espacio de color). ). [3] [4] Además de la misma luminancia (relativa), este método también garantiza que ambas imágenes tendrán la misma luminancia absoluta cuando se muestren, como se puede medir con instrumentos en sus unidades SI de candelas por metro cuadrado , en cualquier área dada de la imagen, dados puntos blancos iguales . La luminancia en sí se define utilizando un modelo estándar de visión humana, por lo que preservar la luminancia en la imagen en escala de grises también preserva otras medidas de luminosidad perceptiva , como L * (como en el espacio de color CIE Lab de 1976 ), que está determinada por la luminancia lineal Y. en sí (como en el espacio de color CIE 1931 XYZ ) al que nos referiremos aquí como Y lineal para evitar cualquier ambigüedad.

Para convertir un color de un espacio de color basado en un modelo de color RGB típico comprimido con gamma (no lineal) a una representación en escala de grises de su luminancia, primero se debe eliminar la función de compresión gamma mediante expansión gamma (linealización) para transformar la imagen a un RGB lineal. espacio de color, de modo que se pueda aplicar la suma ponderada adecuada a los componentes de color lineal ( ) para calcular la luminancia lineal Y lineal , que luego se puede volver a comprimir gamma si el resultado en escala de grises también se va a codificar y almacenar en un formato no lineal típico. espacio de color. [5]

Para el espacio de color sRGB común , la expansión gamma se define como

donde C srgb representa cualquiera de los tres primarios sRGB comprimidos con gamma ( R srgb , G srgb y B srgb , cada uno en el rango [0,1]) y C lineal es el valor de intensidad lineal correspondiente ( R lineal , G lineal , y B lineal , también en el rango [0,1]). Luego, la luminancia lineal se calcula como una suma ponderada de los tres valores de intensidad lineal. El espacio de color sRGB se define en términos de la luminancia lineal Y lineal CIE 1931 , que viene dada por [6]

Estos tres coeficientes particulares representan la percepción de intensidad (luminancia) de los humanos tricromáticos típicos a la luz del Rec preciso. 709 colores primarios aditivos (cromaticidades) que se utilizan en la definición de sRGB. La visión humana es más sensible al verde, por lo que tiene el mayor valor de coeficiente (0,7152), y menos sensible al azul, por lo que tiene el coeficiente más pequeño (0,0722). Para codificar la intensidad de la escala de grises en RGB lineal, cada uno de los tres componentes de color se puede configurar para que sea igual a la luminancia lineal calculada (reemplazando por los valores para obtener esta escala de grises lineal), que luego normalmente debe comprimirse con gamma para volver a una escala de grises no convencional. -representación lineal. [7] Para sRGB, cada uno de sus tres primarios se establece en el mismo Y srgb comprimido con gamma dado por la inversa de la expansión gamma anterior como

Debido a que los tres componentes sRGB son iguales, lo que indica que en realidad es una imagen gris (no color), solo es necesario almacenar estos valores una vez, y a esto lo llamamos imagen en escala de grises resultante. Así es como normalmente se almacenará en formatos de imagen compatibles con sRGB que admitan una representación en escala de grises de un solo canal, como JPEG o PNG. Los navegadores web y otro software que reconoce imágenes sRGB deberían producir la misma representación para una imagen en escala de grises que para una imagen sRGB "en color" que tenga los mismos valores en los tres canales de color.

Codificación luma en sistemas de vídeo.

Para imágenes en espacios de color como Y'UV y sus parientes, que se utilizan en sistemas de video y televisión en color estándar como PAL , SECAM y NTSC , un componente de luma no lineal ( Y ) se calcula directamente a partir de intensidades primarias comprimidas con gamma. como una suma ponderada, que, aunque no es una representación perfecta de la luminancia colorimétrica, se puede calcular más rápidamente sin la expansión y compresión gamma utilizadas en los cálculos fotométricos/colorimétricos. En los modelos Y'UV y Y'IQ utilizados por PAL y NTSC, el componente luma rec601 ( Y ) se calcula como

ITU-R BT.709 utilizado para HDTVATSC
ITU-R BT.2100 para televisión HDR

Normalmente, estos espacios de color se transforman nuevamente a R'G'B' no lineal antes de renderizarlos para su visualización. En la medida en que quede suficiente precisión, se podrán representar con precisión.

Pero si el propio componente luma Y' se utiliza directamente como una representación en escala de grises de la imagen en color, la luminancia no se conserva: dos colores pueden tener la misma luma Y pero diferente luminancia lineal CIE Y (y por lo tanto diferente Y srgb no lineal como se define arriba) y por lo tanto parecen más oscuros o más claros para un humano típico que el color original. De manera similar, dos colores que tienen la misma luminancia Y (y por lo tanto el mismo Y srgb ) tendrán en general una luma diferente según cualquiera de las definiciones de luma Y anteriores. [8]

Escala de grises como canales únicos de imágenes en color multicanal

Las imágenes en color a menudo se construyen a partir de varios canales de color apilados , cada uno de los cuales representa niveles de valor del canal determinado. Por ejemplo, las imágenes RGB se componen de tres canales independientes para componentes de colores primarios rojo, verde y azul; Las imágenes CMYK tienen cuatro canales para planchas de tinta cian, magenta, amarilla y negra , etc.

A continuación se muestra un ejemplo de división de canales de color de una imagen en color RGB completa. La columna de la izquierda muestra los canales de color aislados en colores naturales, mientras que a la derecha están sus equivalencias en escala de grises:

Composición de RGB a partir de tres imágenes en escala de grises.

También es posible lo contrario: crear una imagen a todo color a partir de sus canales de escala de grises separados. Al alterar los canales, utilizar compensaciones, rotar y otras manipulaciones, se pueden lograr efectos artísticos en lugar de reproducir con precisión la imagen original.

Ver también

Referencias

  1. ^ Johnson, Stephen (2006). Stephen Johnson sobre fotografía digital. O'Reilly. ISBN 0-596-52370-X.
  2. ^ Poynton, Charles (2012). Vídeo digital y HD: algoritmos e interfaces (2ª ed.). Morgan Kaufman . págs. 31–35, 65–68, 333, 337. ISBN 978-0-12-391926-7. Consultado el 31 de marzo de 2022 .
  3. ^ Poynton, Charles A. (14 de marzo de 2022). Escrito en San José, California. Rogowitz, BE; Pappas, Tennessee (eds.). Rehabilitación de Gamma (PDF) . Conferencia SPIE/IS&T 3299: Visión humana e imágenes electrónicas III; 26 al 30 de enero de 1998. Bellingham, Washington: SPIE. doi :10.1117/12.320126. Archivado (PDF) desde el original el 23 de abril de 2023.
  4. ^ Poynton, Charles A. (25 de febrero de 2004). "Luminancia constante". Ingeniería de Vídeo . Archivado desde el original el 16 de marzo de 2023.
  5. ^ Lindbloom, Bruce (6 de abril de 2017). "Información del espacio de trabajo RGB". Archivado desde el original el 1 de junio de 2023.
  6. ^ Alimenta, Michael; Anderson, Mateo; Chandrasekar, Srinivasan; Motta, Ricardo (5 de noviembre de 1996). "Un espacio de color estándar predeterminado para Internet: sRGB". Consorcio World Wide Web - Gráficos en la Web . Parte 2, matriz en la ecuación 1.8. Archivado desde el original el 24 de mayo de 2023.
  7. ^ Hamburguesa, Wilhelm; Burge, Mark J. (2010). Principios de los algoritmos básicos de procesamiento de imágenes digitales. Medios de ciencia y negocios de Springer. págs. 110-111. ISBN 978-1-84800-195-4.
  8. ^ Poynton, Charles A. (15 de julio de 1997). "La magnitud de los errores de luminancia no constantes" (PDF) .