Una relación de aspecto de píxeles (a menudo abreviada como PAR ) es una relación matemática que describe el ancho de un píxel en una imagen digital en comparación con la altura de ese píxel.
La mayoría de los sistemas de procesamiento de imágenes digitales muestran una imagen como una cuadrícula de píxeles cuadrados diminutos. Sin embargo, algunos sistemas de procesamiento de imágenes, especialmente aquellos que deben ser compatibles con películas de televisión de definición estándar , muestran una imagen como una cuadrícula de píxeles rectangulares, en la que el ancho y la altura de los píxeles son diferentes. La relación de aspecto de los píxeles describe esta diferencia.
El uso de la relación de aspecto de píxeles se aplica principalmente a imágenes de televisión de definición estándar y algunos otros casos excepcionales. La mayoría de los demás sistemas de imágenes, incluidos los que cumplen con las normas y prácticas de SMPTE , utilizan píxeles cuadrados.
PAR también se conoce como relación de aspecto de muestra y se abrevia como SAR , aunque puede confundirse con la relación de aspecto de almacenamiento .
La relación entre el ancho y la altura de una imagen se conoce como relación de aspecto o, más precisamente, relación de aspecto de pantalla (DAR, por sus siglas en inglés): la relación de aspecto de la imagen tal como se muestra; para la televisión, la DAR era tradicionalmente 4:3 (también conocida como pantalla completa), y ahora es 16:9 (también conocida como pantalla ancha) el estándar para la televisión de alta definición. En las imágenes digitales , existe una distinción con la relación de aspecto de almacenamiento (SAR, por sus siglas en inglés), que es la relación de las dimensiones de los píxeles . Si una imagen se muestra con píxeles cuadrados, estas relaciones coinciden; si no, se utilizan píxeles no cuadrados, "rectangulares", y estas relaciones no coinciden. La relación de aspecto de los píxeles en sí se conoce como relación de aspecto de píxeles (PAR, por sus siglas en inglés) -para los píxeles cuadrados es 1:1- y están relacionadas por la identidad:
Reordenando (resolviendo para PAR) obtenemos:
Por ejemplo:
En imágenes analógicas como el cine no existe la noción de píxel, ni tampoco la noción de SAR o PAR, pero en la digitalización de imágenes analógicas la imagen digital resultante tiene píxeles, de ahí SAR (y en consecuencia PAR, si se muestra con la misma relación de aspecto que el original).
Los píxeles no cuadrados aparecen a menudo en los primeros estándares de televisión digital, relacionados con la digitalización de señales de televisión analógica (cuyas resoluciones verticales y horizontales "efectivas" difieren y, por lo tanto, se describen mejor mediante píxeles no cuadrados), y también en algunas cámaras de vídeo digitales y modos de visualización de ordenadores , como el adaptador de gráficos en color (CGA). Hoy en día, aparecen también en la transcodificación entre resoluciones con diferentes SAR.
Las pantallas reales generalmente no tienen píxeles no cuadrados, aunque los sensores digitales pueden tenerlos; son más bien una abstracción matemática utilizada para remuestrear imágenes y convertirlas entre resoluciones.
Existen varios factores que complican la comprensión del PAR, en particular en lo que respecta a la digitalización de vídeo analógico:
El vídeo se presenta como una serie secuencial de imágenes llamadas fotogramas de vídeo. Históricamente, los fotogramas de vídeo se creaban y grababan en formato analógico. A medida que la tecnología de visualización digital, la tecnología de transmisión digital y la compresión de vídeo digital evolucionaron por separado, se produjeron diferencias en los fotogramas de vídeo que deben abordarse mediante la relación de aspecto de píxeles. Los fotogramas de vídeo digital se definen generalmente como una cuadrícula de píxeles que se utiliza para presentar cada imagen secuencial. El componente horizontal se define por píxeles (o muestras) y se conoce como línea de vídeo. El componente vertical se define por la cantidad de líneas, como en 480 líneas.
Las normas y prácticas de televisión de definición estándar se desarrollaron como tecnologías de transmisión y estaban destinadas a la transmisión terrestre, por lo que no se diseñaron para la presentación de video digital. Dichas normas definen una imagen como una matriz de " líneas " horizontales bien definidas, una " duración de línea " vertical bien definida y un centro de imagen bien definido. Sin embargo, no existe una norma de televisión de definición estándar que defina adecuadamente los bordes de la imagen o exija explícitamente una cierta cantidad de elementos de imagen por línea. Además, los sistemas de video analógico como NTSC 480i y PAL 576i , en lugar de emplear cuadros mostrados progresivamente, emplean campos o medios cuadros entrelazados que se muestran de manera entrelazada para reducir el parpadeo y duplicar la velocidad de la imagen para un movimiento más suave.
Como resultado de que las computadoras se volvieron lo suficientemente potentes como para servir como herramientas de edición de video , se crearon convertidores de video digital a analógico y convertidores analógicos a digitales para superar esta incompatibilidad. Para convertir las líneas de video analógicas en una serie de píxeles cuadrados, la industria adoptó una frecuencia de muestreo predeterminada en la que los valores de luminancia se extraían en píxeles. La frecuencia de muestreo de luminancia para imágenes 480i era de 12+3 ⁄ 11 MHzy para imágenes 576i fue 14+3 ⁄ 4MHz .
El término relación de aspecto de píxeles se acuñó por primera vez cuando la ITU-R BT.601 (comúnmente conocida como Rec. 601 ) especificó que las imágenes de televisión de definición estándar están formadas por líneas de exactamente 720 píxeles no cuadrados. La ITU-R BT.601 no definió la relación de aspecto de píxeles exacta, pero proporcionó suficiente información para calcular la relación de aspecto de píxeles exacta en función de las prácticas de la industria: la frecuencia de muestreo de luma estándar de exactamente 13+1 ⁄ 2 MHz. En base a esta información:
La norma SMPTE RP 187 intentó además estandarizar los valores de la relación de aspecto de los píxeles para 480i y 576i . Designó 177:160 para 480i o 1035:1132 para 576i . Sin embargo, debido a las diferencias significativas con las prácticas vigentes en la industria y la carga computacional que imponían sobre el hardware involucrado, la norma SMPTE RP 187 simplemente se ignoró. El anexo de información A.4 de la norma SMPTE RP 187 sugirió además el uso de 10:11 para 480i .
Al momento de escribir este artículo, ITU-R BT.601-6, que es la última edición de ITU-R BT.601, todavía implica que las relaciones de aspecto de píxeles mencionadas anteriormente son correctas.
Como se indicó anteriormente, la norma ITU-R BT.601 especificó que las imágenes de televisión de definición estándar están formadas por líneas de 720 píxeles no cuadrados, muestreadas con una frecuencia de muestreo especificada con precisión. Un cálculo matemático simple revela que un ancho de 704 píxeles sería suficiente para contener una imagen estándar 4:3 de 480i o 576i :
Lamentablemente, no todas las imágenes de televisión estándar son exactamente 4:3: como se mencionó anteriormente, en el video analógico, el centro de una imagen está bien definido, pero los bordes de la imagen no están estandarizados. Como resultado, algunos dispositivos analógicos (principalmente dispositivos PAL, pero también algunos dispositivos NTSC) generaron imágenes en movimiento que eran horizontalmente (ligeramente) más anchas. Esto también se aplica proporcionalmente a las imágenes de pantalla ancha anamórficas (16:9). Por lo tanto, para mantener un margen de error seguro, ITU-R BT.601 requirió muestrear 16 píxeles no cuadrados más por línea (8 más en cada borde) para garantizar que se guardaran todos los datos de video cerca de los márgenes.
Sin embargo, este requisito tuvo implicaciones para las películas en formato PAL. Las relaciones de aspecto de píxeles PAL para pantallas anchas estándar (4:3) y anamórficas (16:9), respectivamente 59:54 y 118:81, eran incómodas para el procesamiento de imágenes digitales, especialmente para mezclar videoclips PAL y NTSC. Por lo tanto, los productos de edición de video eligieron valores casi equivalentes, respectivamente 12:11 y 16:11, que eran más elegantes y podían crear imágenes digitales PAL con exactamente 704 píxeles de ancho, como se ilustra:
En Internet y en otros medios publicados se encuentran numerosas fuentes que introducen valores diferentes y altamente incompatibles como las relaciones de aspecto de píxeles de varias imágenes y sistemas de vídeo. (Consulte la sección Fuentes complementarias).
Para juzgar de manera neutral la precisión y/o viabilidad de estas fuentes, tenga en cuenta que, como la película digital se inventó años después de la película tradicional, todas las imágenes de video destinadas a la televisión de definición estándar y medios compatibles, digitales o de otro tipo, tienen (y deben tener) especificaciones compatibles con la televisión de definición estándar. Por lo tanto, la relación de aspecto de píxeles del video digital debe calcularse a partir de la especificación de equipos tradicionales comunes en lugar de las especificaciones del video digital. De lo contrario, cualquier relación de aspecto de píxeles que se calcule a partir de una fuente de video digital solo se puede utilizar en ciertos casos para el mismo tipo de fuentes de video y no se puede considerar/utilizar como una relación de aspecto de píxeles general de ningún sistema de televisión de definición estándar.
Además, a diferencia del vídeo digital, que tiene bordes de imagen bien definidos, los sistemas de vídeo tradicionales nunca han estandarizado un borde bien definido para la imagen. Por lo tanto, la relación de aspecto de píxeles de los sistemas de televisión estándar comunes no se puede calcular en función de los bordes de las imágenes. Un valor de relación de aspecto calculado de este tipo no sería completamente erróneo, pero tampoco se puede considerar como la relación de aspecto de píxeles general de ningún sistema de vídeo específico. El uso de dichos valores estaría restringido solo a ciertos casos.
En los sistemas de imágenes digitales y televisores de alta definición modernos , especialmente aquellos que cumplen con los estándares y prácticas SMPTE, solo se utilizan píxeles cuadrados para transmisión y visualización. Sin embargo, algunos formatos (por ejemplo, HDV , DVCPRO HD ) utilizan píxeles no cuadrados internamente para el almacenamiento de imágenes, como una forma de reducir la cantidad de datos que se deben procesar, lo que limita las velocidades de transferencia necesarias y mantiene la compatibilidad con las interfaces existentes.
Al asignar directamente una imagen con una determinada relación de aspecto de píxeles a un dispositivo cuya relación de aspecto de píxeles es diferente, la imagen se ve estirada o aplastada de forma poco natural, tanto en dirección horizontal como vertical. Por ejemplo, un círculo generado para una pantalla de computadora con píxeles cuadrados se ve como una elipse vertical en un televisor NTSC de definición estándar que utiliza píxeles rectangulares verticales. Este problema es más evidente en los televisores de pantalla ancha.
Los programas de edición de vídeo que editan archivos de vídeo con píxeles no cuadrados deben tener en cuenta la relación de aspecto de los píxeles, especialmente al mezclar clips de vídeo con diferentes relaciones de aspecto de píxeles. Este sería el caso al crear un montaje de vídeo a partir de varias cámaras que emplean diferentes estándares de vídeo (una situación relativamente poco frecuente). Los programas de efectos especiales también deben tener en cuenta la relación de aspecto de los píxeles, ya que algunos efectos especiales requieren el cálculo de las distancias desde un punto determinado para que se vean visualmente correctos. Un ejemplo de estos efectos sería el desenfoque radial, el desenfoque de movimiento o incluso una simple rotación de la imagen.
El valor de la relación de aspecto de píxeles se utiliza principalmente en software de vídeo digital, donde las imágenes en movimiento deben convertirse o reacondicionarse para utilizar sistemas de vídeo distintos del original. El software de reproducción de vídeo puede utilizar la relación de aspecto de píxeles para reproducir correctamente el vídeo digital en la pantalla. El software de edición de vídeo utiliza la relación de aspecto de píxeles para escalar y reproducir correctamente un vídeo en un nuevo formato.
El soporte de la relación de aspecto de píxeles también es necesario para mostrar, sin distorsión, imágenes digitales heredadas de los estándares informáticos y los videojuegos que existían en los años 80. En esa generación, los píxeles cuadrados eran demasiado caros de producir, por lo que las máquinas y tarjetas de vídeo como SNES , CGA , EGA , Hercules , C64 , MSX , PC-88 , X68000 , etc. tenían píxeles no cuadrados. [1]
La relación de aspecto de píxeles a menudo se confunde con diferentes tipos de relaciones de aspecto de imagen; la relación entre el ancho y la altura de la imagen. Debido a la falta de cuadratura de los píxeles en la televisión de definición estándar, existen dos tipos de dichas relaciones de aspecto: relación de aspecto de almacenamiento ( SAR ) y relación de aspecto de visualización (abreviada DAR , también conocida como relación de aspecto de imagen y relación de aspecto de imagen ). Además, la relación de aspecto de píxeles ( PAR ) también se conoce como relación de aspecto de muestra (abreviada SAR ) en algunos estándares industriales (como H.264 [2] ) y salida de programas (como ffmpeg [3] ). Tenga en cuenta la reutilización de las abreviaturas PAR y SAR . Este artículo utiliza solo los términos relación de aspecto de píxeles, relación de aspecto de visualización y relación de aspecto de almacenamiento para evitar ambigüedades.
La relación de aspecto de almacenamiento es la relación entre el ancho y la altura de la imagen en píxeles y se puede calcular fácilmente a partir del archivo de video. La relación de aspecto de visualización es la relación entre el ancho y la altura de la imagen (en una unidad de longitud, como centímetros o pulgadas) cuando se muestra en la pantalla y se calcula a partir de la combinación de la relación de aspecto de píxeles y la relación de aspecto de almacenamiento.
Sin embargo, los usuarios que conocen la definición de estos conceptos también pueden confundirse. Las interfaces de usuario mal diseñadas o las documentaciones mal redactadas pueden causar fácilmente esta confusión: algunas aplicaciones de software de edición de vídeo suelen pedir a los usuarios que especifiquen una "relación de aspecto" para su archivo de vídeo, presentándoles las opciones de "4:3" y "16:9". A veces, estas opciones pueden ser "PAL 4:3", "NTSC 4:3", "PAL 16:9" y "NTSC 16:9". En tales situaciones, el programa de edición de vídeo pide implícitamente la relación de aspecto de píxeles del archivo de vídeo al solicitar información sobre el sistema de vídeo del que procede el archivo de vídeo. A continuación, el programa utiliza una tabla (similar a la que se muestra a continuación) para determinar el valor correcto de la relación de aspecto de píxeles.
En términos generales, para evitar confusiones, se puede suponer que los productos de edición de vídeo nunca piden la relación de aspecto de almacenamiento, ya que pueden recuperarla o calcularla directamente. Las aplicaciones que no tienen en cuenta los píxeles cuadrados también necesitan pedir únicamente la relación de aspecto de píxeles o la relación de aspecto de pantalla, a partir de las cuales pueden calcular la otra.
A continuación se enumeran los valores de relación de aspecto de píxeles para los formatos de vídeo de definición estándar más comunes. Tenga en cuenta que para los formatos de vídeo PAL, se enumeran dos tipos diferentes de valores de relación de aspecto de píxeles:
Tenga en cuenta que las fuentes difieren en las PAR para los formatos comunes; por ejemplo, 576 líneas (PAL) mostradas en 4:3 (DAR) corresponden a una PAR de 12:11 (si es 704×576, SAR = 11:9) o una PAR de 16:15 (si es 720×576, SAR = 5:4). Consulte las referencias para obtener fuentes que proporcionen ambas, y SDTV: Resolution para obtener una tabla de relaciones de aspecto de almacenamiento, visualización y píxeles. Tenga en cuenta también que los televisores CRT no tienen píxeles, sino líneas de exploración.