Relación de aspecto de píxeles

Una relación de aspecto de píxeles (a menudo abreviada como PAR ) es una relación matemática que describe el ancho de un píxel en una imagen digital en comparación con la altura de ese píxel.

La mayoría de los sistemas de procesamiento de imágenes digitales muestran una imagen como una cuadrícula de píxeles cuadrados diminutos. Sin embargo, algunos sistemas de procesamiento de imágenes, especialmente aquellos que deben ser compatibles con películas de televisión de definición estándar , muestran una imagen como una cuadrícula de píxeles rectangulares, en la que el ancho y la altura de los píxeles son diferentes. La relación de aspecto de los píxeles describe esta diferencia.

El uso de la relación de aspecto de píxeles se aplica principalmente a imágenes de televisión de definición estándar y algunos otros casos excepcionales. La mayoría de los demás sistemas de imágenes, incluidos los que cumplen con las normas y prácticas de SMPTE , utilizan píxeles cuadrados.

PAR también se conoce como relación de aspecto de muestra y se abrevia como SAR , aunque puede confundirse con la relación de aspecto de almacenamiento .

Introducción

La relación entre el ancho y la altura de una imagen se conoce como relación de aspecto o, más precisamente, relación de aspecto de pantalla (DAR, por sus siglas en inglés): la relación de aspecto de la imagen tal como se muestra; para la televisión, la DAR era tradicionalmente 4:3 (también conocida como pantalla completa), y ahora es 16:9 (también conocida como pantalla ancha) el estándar para la televisión de alta definición. En las imágenes digitales , existe una distinción con la relación de aspecto de almacenamiento (SAR, por sus siglas en inglés), que es la relación de las dimensiones de los píxeles . Si una imagen se muestra con píxeles cuadrados, estas relaciones coinciden; si no, se utilizan píxeles no cuadrados, "rectangulares", y estas relaciones no coinciden. La relación de aspecto de los píxeles en sí se conoce como relación de aspecto de píxeles (PAR, por sus siglas en inglés) -para los píxeles cuadrados es 1:1- y están relacionadas por la identidad:

Reordenando (resolviendo para PAR) obtenemos:

Por ejemplo:

Una imagen VGA de 640 × 480 tiene un SAR de 640/480 = 4:3 y, si se muestra en una pantalla 4:3 (DAR = 4:3), tiene píxeles cuadrados, por lo tanto, un PAR de 1:1.
En cambio, una imagen PAL de 720 × 576 D-1 tiene una SAR de 720/576 = 5:4, pero si se muestra en una pantalla de 4:3 (DAR = 4:3) la PAR es 4/3 : 5/4 = 16:15 ≈ 1,066. Esto significa que los píxeles de la imagen PAL deben "estirarse" en esta cantidad para que quepan en la pantalla de 4:3.

En imágenes analógicas como el cine no existe la noción de píxel, ni tampoco la noción de SAR o PAR, pero en la digitalización de imágenes analógicas la imagen digital resultante tiene píxeles, de ahí SAR (y en consecuencia PAR, si se muestra con la misma relación de aspecto que el original).

Los píxeles no cuadrados aparecen a menudo en los primeros estándares de televisión digital, relacionados con la digitalización de señales de televisión analógica (cuyas resoluciones verticales y horizontales "efectivas" difieren y, por lo tanto, se describen mejor mediante píxeles no cuadrados), y también en algunas cámaras de vídeo digitales y modos de visualización de ordenadores , como el adaptador de gráficos en color (CGA). Hoy en día, aparecen también en la transcodificación entre resoluciones con diferentes SAR.

Las pantallas reales generalmente no tienen píxeles no cuadrados, aunque los sensores digitales pueden tenerlos; son más bien una abstracción matemática utilizada para remuestrear imágenes y convertirlas entre resoluciones.

Existen varios factores que complican la comprensión del PAR, en particular en lo que respecta a la digitalización de vídeo analógico:

En primer lugar, el vídeo analógico no tiene píxeles, sino un barrido de trama , y por tanto tiene una resolución vertical bien definida (las líneas de la trama), pero no una resolución horizontal bien definida , ya que cada línea es una señal analógica. Sin embargo, mediante una frecuencia de muestreo estandarizada, la resolución horizontal efectiva se puede determinar mediante el teorema de muestreo , como se hace a continuación.
En segundo lugar, debido al sobreescaneo , algunas de las líneas en la parte superior e inferior del ráster no son visibles, al igual que algunas de las posibles imágenes a la izquierda y la derecha (consulte Sobreescaneo: problemas de resolución analógica a digital ). Además, la resolución puede redondearse (DV NTSC utiliza 480 líneas, en lugar de las 486 que son posibles).
En tercer lugar, las señales de vídeo analógicas se entrelazan : cada imagen (fotograma) se envía como dos "campos", cada uno con la mitad de las líneas. Por lo tanto, o bien los píxeles son el doble de altos de lo que serían sin el entrelazado, o bien la imagen está desentrelazada.

Fondo

El vídeo se presenta como una serie secuencial de imágenes llamadas fotogramas de vídeo. Históricamente, los fotogramas de vídeo se creaban y grababan en formato analógico. A medida que la tecnología de visualización digital, la tecnología de transmisión digital y la compresión de vídeo digital evolucionaron por separado, se produjeron diferencias en los fotogramas de vídeo que deben abordarse mediante la relación de aspecto de píxeles. Los fotogramas de vídeo digital se definen generalmente como una cuadrícula de píxeles que se utiliza para presentar cada imagen secuencial. El componente horizontal se define por píxeles (o muestras) y se conoce como línea de vídeo. El componente vertical se define por la cantidad de líneas, como en 480 líneas.

Las normas y prácticas de televisión de definición estándar se desarrollaron como tecnologías de transmisión y estaban destinadas a la transmisión terrestre, por lo que no se diseñaron para la presentación de video digital. Dichas normas definen una imagen como una matriz de " líneas " horizontales bien definidas, una " duración de línea " vertical bien definida y un centro de imagen bien definido. Sin embargo, no existe una norma de televisión de definición estándar que defina adecuadamente los bordes de la imagen o exija explícitamente una cierta cantidad de elementos de imagen por línea. Además, los sistemas de video analógico como NTSC 480i y PAL 576i , en lugar de emplear cuadros mostrados progresivamente, emplean campos o medios cuadros entrelazados que se muestran de manera entrelazada para reducir el parpadeo y duplicar la velocidad de la imagen para un movimiento más suave.

Conversión de analógico a digital

Como resultado de que las computadoras se volvieron lo suficientemente potentes como para servir como herramientas de edición de video , se crearon convertidores de video digital a analógico y convertidores analógicos a digitales para superar esta incompatibilidad. Para convertir las líneas de video analógicas en una serie de píxeles cuadrados, la industria adoptó una frecuencia de muestreo predeterminada en la que los valores de luminancia se extraían en píxeles. La frecuencia de muestreo de luminancia para imágenes 480i era de 12+3 ⁄ 11 MHzy para imágenes 576i fue 14+3 ⁄ 4MHz .

El término relación de aspecto de píxeles se acuñó por primera vez cuando la ITU-R BT.601 (comúnmente conocida como Rec. 601 ) especificó que las imágenes de televisión de definición estándar están formadas por líneas de exactamente 720 píxeles no cuadrados. La ITU-R BT.601 no definió la relación de aspecto de píxeles exacta, pero proporcionó suficiente información para calcular la relación de aspecto de píxeles exacta en función de las prácticas de la industria: la frecuencia de muestreo de luma estándar de exactamente 13+1 ⁄ 2 MHz. En base a esta información:

La relación de aspecto de píxeles para 480i sería 10:11 como:
$12{\tfrac {3}{11}}\div 13{\tfrac {1}{2}}={\tfrac {10}{11}}$
La relación de aspecto de píxeles para 576i sería 59:54 como:
$14{\tfrac {3}{4}}\div 13{\tfrac {1}{2}}={\tfrac {59}{54}}$

La norma SMPTE RP 187 intentó además estandarizar los valores de la relación de aspecto de los píxeles para 480i y 576i . Designó 177:160 para 480i o 1035:1132 para 576i . Sin embargo, debido a las diferencias significativas con las prácticas vigentes en la industria y la carga computacional que imponían sobre el hardware involucrado, la norma SMPTE RP 187 simplemente se ignoró. El anexo de información A.4 de la norma SMPTE RP 187 sugirió además el uso de 10:11 para 480i .

Al momento de escribir este artículo, ITU-R BT.601-6, que es la última edición de ITU-R BT.601, todavía implica que las relaciones de aspecto de píxeles mencionadas anteriormente son correctas.

Procesamiento de vídeo digital

Como se indicó anteriormente, la norma ITU-R BT.601 especificó que las imágenes de televisión de definición estándar están formadas por líneas de 720 píxeles no cuadrados, muestreadas con una frecuencia de muestreo especificada con precisión. Un cálculo matemático simple revela que un ancho de 704 píxeles sería suficiente para contener una imagen estándar 4:3 de 480i o 576i :

Una imagen de 480 líneas de formato 4:3, digitalizada con la frecuencia de muestreo recomendada por Rec. 601, tendría 704 píxeles no cuadrados de ancho.
${\frac {x}{480}}\times {\frac {10}{11}}={\frac {4}{3}}\Rightarrow x={\frac {480\times 11\times 4}{10\times 3}}=704$
Una imagen de 576 líneas de formato 4:3, digitalizada con la frecuencia de muestreo recomendada por Rec. 601, tendría un ancho de 702,915254 píxeles no cuadrados.
${\frac {x}{576}}\times {\frac {59}{54}}={\frac {4}{3}}\Rightarrow x={\frac {576\times 54\times 4}{59\times 3}}\approx 702.915254$

Lamentablemente, no todas las imágenes de televisión estándar son exactamente 4:3: como se mencionó anteriormente, en el video analógico, el centro de una imagen está bien definido, pero los bordes de la imagen no están estandarizados. Como resultado, algunos dispositivos analógicos (principalmente dispositivos PAL, pero también algunos dispositivos NTSC) generaron imágenes en movimiento que eran horizontalmente (ligeramente) más anchas. Esto también se aplica proporcionalmente a las imágenes de pantalla ancha anamórficas (16:9). Por lo tanto, para mantener un margen de error seguro, ITU-R BT.601 requirió muestrear 16 píxeles no cuadrados más por línea (8 más en cada borde) para garantizar que se guardaran todos los datos de video cerca de los márgenes.

Sin embargo, este requisito tuvo implicaciones para las películas en formato PAL. Las relaciones de aspecto de píxeles PAL para pantallas anchas estándar (4:3) y anamórficas (16:9), respectivamente 59:54 y 118:81, eran incómodas para el procesamiento de imágenes digitales, especialmente para mezclar videoclips PAL y NTSC. Por lo tanto, los productos de edición de video eligieron valores casi equivalentes, respectivamente 12:11 y 16:11, que eran más elegantes y podían crear imágenes digitales PAL con exactamente 704 píxeles de ancho, como se ilustra:

Para PAL 4:3:
${\frac {4}{3}}\div {\frac {704}{576}}=\color {blue}{\frac {12}{11}}$
Para PAL 16:9:
${\frac {16}{9}}\div {\frac {704}{576}}=\color {blue}{\frac {16}{11}}$

Inconsistencia en los valores de relación de aspecto de píxeles definidos

En Internet y en otros medios publicados se encuentran numerosas fuentes que introducen valores diferentes y altamente incompatibles como las relaciones de aspecto de píxeles de varias imágenes y sistemas de vídeo. (Consulte la sección Fuentes complementarias).

Para juzgar de manera neutral la precisión y/o viabilidad de estas fuentes, tenga en cuenta que, como la película digital se inventó años después de la película tradicional, todas las imágenes de video destinadas a la televisión de definición estándar y medios compatibles, digitales o de otro tipo, tienen (y deben tener) especificaciones compatibles con la televisión de definición estándar. Por lo tanto, la relación de aspecto de píxeles del video digital debe calcularse a partir de la especificación de equipos tradicionales comunes en lugar de las especificaciones del video digital. De lo contrario, cualquier relación de aspecto de píxeles que se calcule a partir de una fuente de video digital solo se puede utilizar en ciertos casos para el mismo tipo de fuentes de video y no se puede considerar/utilizar como una relación de aspecto de píxeles general de ningún sistema de televisión de definición estándar.

Además, a diferencia del vídeo digital, que tiene bordes de imagen bien definidos, los sistemas de vídeo tradicionales nunca han estandarizado un borde bien definido para la imagen. Por lo tanto, la relación de aspecto de píxeles de los sistemas de televisión estándar comunes no se puede calcular en función de los bordes de las imágenes. Un valor de relación de aspecto calculado de este tipo no sería completamente erróneo, pero tampoco se puede considerar como la relación de aspecto de píxeles general de ningún sistema de vídeo específico. El uso de dichos valores estaría restringido solo a ciertos casos.

Normas y prácticas modernas

En los sistemas de imágenes digitales y televisores de alta definición modernos , especialmente aquellos que cumplen con los estándares y prácticas SMPTE, solo se utilizan píxeles cuadrados para transmisión y visualización. Sin embargo, algunos formatos (por ejemplo, HDV , DVCPRO HD ) utilizan píxeles no cuadrados internamente para el almacenamiento de imágenes, como una forma de reducir la cantidad de datos que se deben procesar, lo que limita las velocidades de transferencia necesarias y mantiene la compatibilidad con las interfaces existentes.

Problemas con los píxeles no cuadrados

Al asignar directamente una imagen con una determinada relación de aspecto de píxeles a un dispositivo cuya relación de aspecto de píxeles es diferente, la imagen se ve estirada o aplastada de forma poco natural, tanto en dirección horizontal como vertical. Por ejemplo, un círculo generado para una pantalla de computadora con píxeles cuadrados se ve como una elipse vertical en un televisor NTSC de definición estándar que utiliza píxeles rectangulares verticales. Este problema es más evidente en los televisores de pantalla ancha.

Los programas de edición de vídeo que editan archivos de vídeo con píxeles no cuadrados deben tener en cuenta la relación de aspecto de los píxeles, especialmente al mezclar clips de vídeo con diferentes relaciones de aspecto de píxeles. Este sería el caso al crear un montaje de vídeo a partir de varias cámaras que emplean diferentes estándares de vídeo (una situación relativamente poco frecuente). Los programas de efectos especiales también deben tener en cuenta la relación de aspecto de los píxeles, ya que algunos efectos especiales requieren el cálculo de las distancias desde un punto determinado para que se vean visualmente correctos. Un ejemplo de estos efectos sería el desenfoque radial, el desenfoque de movimiento o incluso una simple rotación de la imagen.

Uso de la relación de aspecto de píxeles

El valor de la relación de aspecto de píxeles se utiliza principalmente en software de vídeo digital, donde las imágenes en movimiento deben convertirse o reacondicionarse para utilizar sistemas de vídeo distintos del original. El software de reproducción de vídeo puede utilizar la relación de aspecto de píxeles para reproducir correctamente el vídeo digital en la pantalla. El software de edición de vídeo utiliza la relación de aspecto de píxeles para escalar y reproducir correctamente un vídeo en un nuevo formato.

El soporte de la relación de aspecto de píxeles también es necesario para mostrar, sin distorsión, imágenes digitales heredadas de los estándares informáticos y los videojuegos que existían en los años 80. En esa generación, los píxeles cuadrados eran demasiado caros de producir, por lo que las máquinas y tarjetas de vídeo como SNES , CGA , EGA , Hercules , C64 , MSX , PC-88 , X68000 , etc. tenían píxeles no cuadrados. ^[1]

Confusión con la relación de aspecto de la pantalla

La relación de aspecto de píxeles a menudo se confunde con diferentes tipos de relaciones de aspecto de imagen; la relación entre el ancho y la altura de la imagen. Debido a la falta de cuadratura de los píxeles en la televisión de definición estándar, existen dos tipos de dichas relaciones de aspecto: relación de aspecto de almacenamiento ( SAR ) y relación de aspecto de visualización (abreviada DAR , también conocida como relación de aspecto de imagen y relación de aspecto de imagen ). Además, la relación de aspecto de píxeles ( PAR ) también se conoce como relación de aspecto de muestra (abreviada SAR ) en algunos estándares industriales (como H.264 ^[2] ) y salida de programas (como ffmpeg^[3] ). Tenga en cuenta la reutilización de las abreviaturas PAR y SAR . Este artículo utiliza solo los términos relación de aspecto de píxeles, relación de aspecto de visualización y relación de aspecto de almacenamiento para evitar ambigüedades.

La relación de aspecto de almacenamiento es la relación entre el ancho y la altura de la imagen en píxeles y se puede calcular fácilmente a partir del archivo de video. La relación de aspecto de visualización es la relación entre el ancho y la altura de la imagen (en una unidad de longitud, como centímetros o pulgadas) cuando se muestra en la pantalla y se calcula a partir de la combinación de la relación de aspecto de píxeles y la relación de aspecto de almacenamiento.

Sin embargo, los usuarios que conocen la definición de estos conceptos también pueden confundirse. Las interfaces de usuario mal diseñadas o las documentaciones mal redactadas pueden causar fácilmente esta confusión: algunas aplicaciones de software de edición de vídeo suelen pedir a los usuarios que especifiquen una "relación de aspecto" para su archivo de vídeo, presentándoles las opciones de "4:3" y "16:9". A veces, estas opciones pueden ser "PAL 4:3", "NTSC 4:3", "PAL 16:9" y "NTSC 16:9". En tales situaciones, el programa de edición de vídeo pide implícitamente la relación de aspecto de píxeles del archivo de vídeo al solicitar información sobre el sistema de vídeo del que procede el archivo de vídeo. A continuación, el programa utiliza una tabla (similar a la que se muestra a continuación) para determinar el valor correcto de la relación de aspecto de píxeles.

En términos generales, para evitar confusiones, se puede suponer que los productos de edición de vídeo nunca piden la relación de aspecto de almacenamiento, ya que pueden recuperarla o calcularla directamente. Las aplicaciones que no tienen en cuenta los píxeles cuadrados también necesitan pedir únicamente la relación de aspecto de píxeles o la relación de aspecto de pantalla, a partir de las cuales pueden calcular la otra.

Relaciones de aspecto de píxeles de los formatos de vídeo más comunes

A continuación se enumeran los valores de relación de aspecto de píxeles para los formatos de vídeo de definición estándar más comunes. Tenga en cuenta que para los formatos de vídeo PAL, se enumeran dos tipos diferentes de valores de relación de aspecto de píxeles:

Rec.601 , un valor compatible con Rec.601, que se considera la relación de aspecto de píxeles real del vídeo de definición estándar de ese tipo.
Digital , que es aproximadamente equivalente a Rec.601 y es más adecuado para usar en software de edición de video digital.

Tenga en cuenta que las fuentes difieren en las PAR para los formatos comunes; por ejemplo, 576 líneas (PAL) mostradas en 4:3 (DAR) corresponden a una PAR de 12:11 (si es 704×576, SAR = 11:9) o una PAR de 16:15 (si es 720×576, SAR = 5:4). Consulte las referencias para obtener fuentes que proporcionen ambas, y SDTV: Resolution para obtener una tabla de relaciones de aspecto de almacenamiento, visualización y píxeles. Tenga en cuenta también que los televisores CRT no tienen píxeles, sino líneas de exploración.

^ SAR = DAR : PAR = 4/3 : 59/54 = 72/59 (Pero aún no se explica por qué 704 × 576 puede tener dos relaciones de aspecto de almacenamiento: 11:9 y 72:59)
^ SAR = DAR: PAR = 16/9: 118/81 = 72/59

Referencias

Fuentes principales

Unión Internacional de Telecomunicaciones - Sector de Radiocomunicaciones (UIT-R) (enero de 2007). «Recomendación BT.601-6: Parámetros de codificación de estudio de la televisión digital para relaciones de aspecto estándar 4:3 y 16:9 para pantalla ancha». Librería en línea de la UIT . Consultado el 1 de octubre de 2008 .
A partir de la fecha de recuperación, una membresía gratuita de la Librería en línea de la UIT permitiría la descarga gratuita de hasta tres Recomendaciones UIT-R.
Asociación de Electrónica de Consumo (marzo de 2008). «Estándar CEA-861-E de la CEA: perfil DTV para interfaces digitales de alta velocidad sin comprimir». Archivado desde el original el 7 de noviembre de 2011. Consultado el 1 de septiembre de 2009 .
- Este estándar, que es la base de HDMI , especifica 16:15 (1.0666) como la relación de aspecto de píxeles de 4:3 576i/p y 8:9 (0.888) como la relación de aspecto de píxeles de 4:3 480i/p.
Pirazzi, Chris. "Píxeles cuadrados y no cuadrados" . Consultado el 1 de octubre de 2008 .
Pirazzi, Chris. "Guía para programadores de sistemas de vídeo" . Consultado el 1 de octubre de 2008 .
Poynton, Charles (2002). Vídeo digital y HDTV: algoritmos e interfaces . San Francisco: Morgan Kaufmann Publishers. ISBN 1-55860-792-7.
Unión Europea de Radiodifusión (1999). "Recomendación técnica EBU R92-1999: Área de imagen activa y centrado de imagen en sistemas de televisión analógicos y digitales 625/50" (PDF) . Consultado el 12 de junio de 2011 .

Fuentes suplementarias

Adobe Systems Incorporated. "Relaciones de aspecto (-> Relaciones de aspecto de píxeles comunes)". Documentación de Adobe Premiere Pro CS4 . Consultado el 25 de enero de 2009 .
- También está disponible una versión PDF de la documentación de Adobe Premiere Pro CS4 en el sitio web de Adobe .
- Esta fuente especifica 12:11 (1.09) como la relación de aspecto de píxeles de 576i.
Adobe Systems Incorporated. "Relación de aspecto de píxeles y relación de aspecto de fotogramas (-> Relaciones de aspecto de píxeles comunes)". Documentación de Adobe After Effect CS4 . Consultado el 25 de enero de 2009 .
- También está disponible una versión PDF de la documentación de Adobe After Effects CS4 en el sitio web de Adobe .
- Esta fuente especifica 12:11 (1.09) como la relación de aspecto de píxeles de 576i.
Jukka Aho. "Guía rápida para conversiones de resolución y relación de aspecto de vídeo digital". Archivado desde el original el 16 de agosto de 2014. Consultado el 25 de enero de 2009 .
- Esta fuente calcula diferentes valores de relación de aspecto de píxeles para imágenes de 480i y 576i.
Hermano John. "La importancia de la ITU-R BT.601 para la PAR (traducido del alemán)" . Consultado el 26 de noviembre de 2010 .
- Un análisis en profundidad de las discrepancias en las relaciones de aspecto de los píxeles proporcionadas en varias especificaciones.
- Licencia Creative Commons Atribución, No comercial-Compartir igual 3.0 Alemania (CC by-sa)
- Traducción al español: [1]

Notas

^ "Velocidades de reloj de puntos". pineight.com . Consultado el 23 de septiembre de 2018 .
^ "Codificación avanzada de vídeo para servicios audiovisuales genéricos". pág. 25 (7) . Consultado el 10 de junio de 2022 .
^ "ffprobe muestra PAR como SAR". ffmpeg.org . Consultado el 10 de junio de 2022 .

Enlaces externos

La prueba de fuego de la relación de aspecto de los píxeles