stringtranslate.com

Desentrelazado

El desentrelazado es el proceso de convertir un vídeo entrelazado en un formato no entrelazado o progresivo . Las señales de vídeo entrelazadas se encuentran comúnmente en la televisión analógica , VHS , Laserdisc , televisión digital ( HDTV ) cuando está en formato 1080i , algunos títulos de DVD y una menor cantidad de discos Blu-ray .

Un fotograma de vídeo entrelazado consta de dos campos tomados en secuencia: el primero contiene todas las líneas impares de la imagen y el segundo todas las líneas pares. La televisión analógica empleó esta técnica porque permitía un menor ancho de banda de transmisión manteniendo una alta velocidad de fotogramas para un movimiento más suave y real. Una señal no entrelazada (o de exploración progresiva ) que utiliza el mismo ancho de banda solo actualiza la pantalla la mitad de veces y se descubrió que creaba un parpadeo o tartamudeo percibido. Las pantallas basadas en CRT pudieron mostrar vídeo entrelazado correctamente debido a su naturaleza completamente analógica, mezclando las líneas alternas a la perfección. Sin embargo, desde principios de la década de 2000, las pantallas como los televisores y los monitores de computadora se han vuelto casi completamente digitales, en el sentido de que la pantalla está compuesta de píxeles discretos, y en dichas pantallas el entrelazado se hace notar y puede aparecer como un defecto visual que distrae. El proceso de desentrelazado debe tratar de minimizar estos defectos.

Por lo tanto, el desentrelazado es un proceso necesario y viene integrado en la mayoría de los reproductores de DVD, reproductores de Blu-ray, televisores LCD/LED, proyectores digitales, decodificadores de TV, equipos de transmisión profesional y reproductores y editores de video de computadora modernos, aunque cada uno con diferentes niveles de calidad.

El desentrelazado se ha investigado durante décadas y emplea algoritmos de procesamiento complejos; sin embargo, ha sido muy difícil lograr resultados consistentes. [1] [2]

Fondo

Ejemplo de video entrelazado (ralentizado)

Tanto el vídeo como la película fotográfica capturan una serie de fotogramas (imágenes fijas) en rápida sucesión; sin embargo, los sistemas de televisión leen la imagen capturada escaneando en serie el sensor de imagen por líneas (filas). En la televisión analógica, cada fotograma se divide en dos campos consecutivos , uno que contiene todas las líneas pares y otro con las líneas impares. Los campos se capturan en sucesión a una velocidad que duplica la velocidad de fotogramas nominal. Por ejemplo, los sistemas PAL y SECAM tienen una velocidad de 25 fotogramas/s o 50 campos/s, mientras que el sistema NTSC ofrece 29,97 fotogramas/s o 59,94 campos/s. Este proceso de dividir los fotogramas en campos de media resolución al doble de la velocidad de fotogramas se conoce como entrelazado .

Dado que la señal entrelazada contiene los dos campos de un fotograma de vídeo grabados en dos momentos diferentes, mejora la percepción del movimiento por parte del espectador y reduce el parpadeo aprovechando el efecto de persistencia de la visión . Esto da como resultado una duplicación efectiva de la resolución temporal en comparación con el metraje no entrelazado (para frecuencias de cuadro iguales a las frecuencias de campo). Sin embargo, la señal entrelazada requiere una pantalla que sea capaz de mostrar de forma nativa los campos individuales en un orden secuencial, y solo los televisores tradicionales basados ​​en CRT son capaces de mostrar la señal entrelazada, debido al escaneo electrónico y la falta de una resolución fija aparente.

La mayoría de las pantallas modernas, como las LCD , DLP y de plasma , no pueden funcionar en modo entrelazado, porque son pantallas de resolución fija y solo admiten el escaneo progresivo. Para mostrar la señal entrelazada en dichas pantallas, los dos campos entrelazados deben convertirse en un cuadro progresivo con un proceso conocido como desentrelazado . Sin embargo, cuando los dos campos tomados en diferentes puntos del tiempo se vuelven a combinar para mostrar un cuadro completo a la vez, se producen defectos visuales llamados artefactos de entrelazado o peinado con objetos en movimiento en la imagen. Un buen algoritmo de desentrelazado debe intentar evitar los artefactos de entrelazado tanto como sea posible y no sacrificar la calidad de la imagen en el proceso, lo que es difícil de lograr de manera consistente. Hay varias técnicas disponibles que extrapolan la información de la imagen faltante, sin embargo, caen en la categoría de creación de cuadros inteligentes y requieren algoritmos complejos y una potencia de procesamiento sustancial.

Las técnicas de desentrelazado requieren un procesamiento complejo y, por lo tanto, pueden introducir un retraso en la señal de vídeo. Aunque no suele ser perceptible, esto puede provocar que la visualización de videojuegos antiguos se retrase con respecto a la entrada del mando. Por ello, muchos televisores tienen un "modo de juego" en el que se realiza un procesamiento mínimo para maximizar la velocidad a expensas de la calidad de la imagen. El desentrelazado es solo parcialmente responsable de dicho retraso; el escalado también implica algoritmos complejos que tardan milisegundos en ejecutarse.

Material fuente progresivo

Es posible que algunos videos entrelazados se hayan creado originalmente a partir de material progresivo, y el proceso de desentrelazado también debería tener esto en cuenta.

El material cinematográfico típico se graba en película de 24 fotogramas por segundo. La conversión de película a vídeo entrelazado suele utilizar un proceso denominado telecine , en el que cada fotograma se convierte en varios campos. En algunos casos, cada fotograma de la película se puede presentar exactamente mediante dos fotogramas segmentados progresivos (PsF), y en este formato no se requiere un algoritmo de desentrelazado complejo porque cada campo contiene una parte del mismo fotograma progresivo. Sin embargo, para que coincida con la señal PAL/SECAM entrelazada de 50 campos o la señal NTSC entrelazada de 59,94/60 campos, es necesaria la conversión de la velocidad de fotogramas mediante diversas técnicas de "desplazamiento". La mayoría de los televisores avanzados pueden restaurar la señal original de 24 fotogramas por segundo mediante un proceso de telecine inverso . Otra opción es acelerar la película de 24 fotogramas en un 4% (a 25 fotogramas por segundo) para la conversión PAL/SECAM; este método todavía se utiliza ampliamente para DVD, así como para emisiones de televisión (SD y HD) en los mercados PAL.

Los DVD pueden codificar películas utilizando uno de estos métodos o almacenar videos progresivos originales de 24 cuadros por segundo y utilizar etiquetas de decodificador MPEG-2 para indicarle al reproductor de video cómo convertirlos al formato entrelazado. La mayoría de las películas en formato Blu-ray han conservado la velocidad de movimiento original de la película de 24 cuadros por segundo sin entrelazar y permiten la salida en el formato progresivo 1080p24 directamente a los dispositivos de visualización, sin necesidad de conversión.

Algunas videocámaras HDV 1080i también ofrecen el modo PsF con velocidades de cuadro similares a las del cine de 24 o 25 cuadros por segundo. Los equipos de producción de televisión también pueden utilizar cámaras de película especiales que funcionan a 25 o 30 cuadros por segundo, cuando dicho material no necesita conversión de velocidad de cuadros para su transmisión en el formato del sistema de video deseado.

Métodos de desentrelazado

Cuando alguien mira un video entrelazado en un monitor progresivo con un desentrelazado deficiente, puede ver un "peinado" en el movimiento entre dos campos de un cuadro.

El desentrelazado requiere que la pantalla almacene en búfer uno o más campos y los vuelva a combinar para formar cuadros completos. En teoría, esto sería tan simple como capturar un campo y combinarlo con el siguiente campo que se va a recibir, lo que produce un solo cuadro. Sin embargo, la señal grabada originalmente se produjo a partir de dos campos en diferentes puntos en el tiempo y, sin un procesamiento especial, cualquier movimiento a través de los campos generalmente da como resultado un efecto de "peinado" en el que las líneas alternas se desplazan ligeramente entre sí.

Existen varios métodos para desentrelazar videos, cada uno de los cuales produce distintos problemas o artefactos propios. Algunos métodos son mucho más limpios en cuanto a artefactos que otros.

La mayoría de las técnicas de desentrelazado se dividen en tres grandes grupos:

  1. Desentrelazado de combinación de campos que toma los campos pares e impares y los combina en un solo cuadro. Esto reduce a la mitad la velocidad de cuadros percibida (la resolución temporal), por lo que 50i o 60i se convierte a 25p o 30p.
  2. Desentrelazado de extensión de campo que toma cada campo (con solo la mitad de las líneas) y lo extiende a toda la pantalla para formar un marco. Esto reduce a la mitad la resolución vertical de la imagen, pero mantiene la velocidad de campo original (50i o 60i se convierte a 50p o 60p).
  3. Desentrelazado con compensación de movimiento que utiliza algoritmos más avanzados para detectar el movimiento en los campos y cambia de técnica cuando es necesario. Esto produce el mejor resultado de calidad, pero requiere la mayor potencia de procesamiento.

Por lo tanto, los sistemas de desentrelazado modernos almacenan en búfer varios campos y utilizan técnicas como la detección de bordes en un intento de encontrar el movimiento entre los campos. Esto se utiliza luego para interpolar las líneas faltantes del campo original, lo que reduce el efecto de peinado. [3]

Desentrelazado de combinación de campos

Estos métodos toman los campos pares e impares y los combinan en un solo cuadro. Mantienen la resolución vertical completa a expensas de la resolución temporal (velocidad de cuadros percibida), por lo que 50i/60i se convierte a 24p/25p/30p, lo que puede perder la sensación de suavidad y fluidez del original. Sin embargo, si la señal entrelazada se produjo originalmente a partir de una fuente con una velocidad de cuadros más baja, como una película, entonces no se pierde información y estos métodos pueden ser suficientes.

Tejeduría
Mezcla

Desentrelazado de extensión de campo

Estos métodos toman cada campo (con solo la mitad de las líneas) y lo extienden a toda la pantalla para formar un marco. Esto puede reducir a la mitad la resolución vertical de la imagen, pero tiene como objetivo mantener la velocidad de campo original (50i o 60i se convierte a 50p o 60p).

Reducción del tamaño a la mitad
Duplicación de línea

La duplicación de línea a veces se confunde con el desentrelazado en general, o con la interpolación (escalado de imagen) que utiliza filtrado espacial para generar líneas adicionales y, por lo tanto, reducir la visibilidad de la pixelación en cualquier tipo de pantalla. [4] La terminología "duplicador de línea" se utiliza con más frecuencia en la electrónica de consumo de alta gama, mientras que "desentrelazado" se utiliza con más frecuencia en el ámbito de las computadoras y el video digital.

Desentrelazado con compensación de movimiento

Los algoritmos de desentrelazado más avanzados combinan los métodos tradicionales de combinación de campos (entrelazado y combinación) y los métodos de extensión de fotogramas (duplicación de líneas o de balanceo) para crear una secuencia de vídeo progresiva de alta calidad. Una de las pistas básicas sobre la dirección y la cantidad de movimiento sería la dirección y la longitud de los artefactos de peinado en la señal entrelazada.

Los mejores algoritmos también intentan predecir la dirección y la cantidad de movimiento de la imagen entre los campos subsiguientes para combinar mejor los dos campos. Pueden emplear algoritmos similares a la compensación de movimiento de bloques que se utiliza en la compresión de vídeo. Por ejemplo, si dos campos tuvieran la cara de una persona moviéndose hacia la izquierda, el entrelazado crearía un efecto de peinado y la combinación crearía imágenes superpuestas. La compensación de movimiento avanzada (idealmente) vería que la cara en varios campos es la misma imagen, solo que movida a una posición diferente, e intentaría detectar la dirección y la cantidad de dicho movimiento. El algoritmo intentaría entonces reconstruir el detalle completo de la cara en ambos fotogramas de salida combinando las imágenes juntas, moviendo partes de cada campo a lo largo de la dirección detectada según la cantidad de movimiento detectada. Los desentrelazadores que utilizan esta técnica suelen ser superiores porque pueden utilizar información de muchos campos, en lugar de solo uno o dos, sin embargo, requieren un hardware potente para lograr esto en tiempo real.

La compensación de movimiento debe combinarse con la detección de cambios de escena (que tiene sus propios desafíos); de lo contrario, intentará encontrar movimiento entre dos escenas completamente diferentes. Un algoritmo de compensación de movimiento mal implementado interferiría con el movimiento natural y podría generar artefactos visuales que se manifiestan como partes "saltadas" en lo que debería ser una imagen estática o en movimiento suave.

Medición de calidad

Los diferentes métodos de desentrelazado tienen diferentes características de calidad y velocidad.

Generalmente, para medir la calidad del método de desentrelazado, se utiliza el siguiente enfoque:

  1. Se compone de un conjunto de vídeos progresivos
  2. Todos estos videos están entrelazados.
  3. Cada uno de los vídeos entrelazados se desentrelaza con un método de desentrelazado específico.
  4. Todos los videos desentrelazados se comparan con el video fuente correspondiente a través de métricas de calidad de video objetivas, como PSNR , SSIM o VMAF .

La métrica principal para medir la velocidad son los cuadros por segundo (FPS) , es decir, la cantidad de cuadros que el desentrelazador puede procesar por segundo. Al hablar de FPS, es necesario especificar la resolución de todos los cuadros y las características del hardware, ya que la velocidad de un método de desentrelazado específico depende en gran medida de estos dos factores.

Puntos de referencia

Desafío de desentrelazado 2019

En este punto de referencia se han comparado ocho métodos de desentrelazado diferentes en un vídeo sintético. Hay una curva de Lissajous tridimensional en movimiento en el vídeo para que resulte un reto para los métodos de desentrelazado modernos. Los autores utilizaron MSE y PSNR como métricas objetivas. Además, miden la velocidad de procesamiento en FPS . Para algunos métodos solo hay una comparación visual, para otros, solo objetiva. [5]

Punto de referencia del desentrelazador de la MSU

Este benchmark ha comparado más de 20 métodos en 40 secuencias de vídeo. La longitud total de las secuencias es de 834 fotogramas. Sus autores afirman que la característica principal de este benchmark es la comparación exhaustiva de métodos con herramientas de comparación visual, gráficos de rendimiento y ajuste de parámetros. Los autores utilizaron PSNR y SSIM como métricas objetivas. [7]

El autor de VapourSynth TDeintMod afirma que es un desentrelazador adaptativo de movimiento bidireccional. El método NNEDI utiliza una red neuronal para desentrelazar secuencias de video. El filtro de desentrelazado Bob Weaver de FFmpeg es parte de un marco conocido para el procesamiento de video y audio. Vapoursynth EEDI3 es la abreviatura de "interpolación dirigida por bordes mejorada 3", los autores de este método afirman que funciona al encontrar la mejor deformación no decreciente entre dos líneas de acuerdo con un costo funcional. Los autores de Real-Time Deep Video Deinterlacer utilizan Deep CNN para obtener la mejor calidad de video de salida.

Dónde se realiza el desentrelazado

El desentrelazado de una señal de vídeo entrelazada se puede realizar en varios puntos de la cadena de producción de TV.

Medios progresistas

El desentrelazado es necesario para programas de archivo entrelazados cuando el formato de transmisión o el formato de medios es progresivo, como en la transmisión EDTV 576p o HDTV 720p50, o la transmisión DVB-H móvil; hay dos maneras de lograr esto.

Medios entrelazados

Cuando el formato de transmisión o el formato de medios es entrelazado, el desentrelazado en tiempo real debe realizarse mediante circuitos integrados en un decodificador, un televisor, un procesador de video externo, un reproductor de DVD o DVR o una tarjeta sintonizadora de TV. Dado que los equipos electrónicos de consumo suelen ser mucho más económicos, tienen considerablemente menos potencia de procesamiento y utilizan algoritmos más simples en comparación con los equipos de desentrelazado profesionales, la calidad del desentrelazado puede variar ampliamente y los resultados típicos suelen ser deficientes incluso en equipos de alta gama. [ cita requerida ]

El uso de una computadora para reproducción y/o procesamiento permite potencialmente una elección más amplia de reproductores de video y/o software de edición no limitado a la calidad ofrecida por el dispositivo electrónico de consumo incorporado, por lo que al menos teóricamente es posible una mayor calidad de desentrelazado, especialmente si el usuario puede preconvertir el video entrelazado a escaneo progresivo antes de la reproducción y algoritmos de desentrelazado avanzados y que consumen mucho tiempo (es decir, empleando el método de "producción").

Sin embargo, la calidad del software gratuito y comercial para el consumidor puede no estar a la altura del software y el equipo profesionales. Además, la mayoría de los usuarios no están capacitados en producción de video; esto a menudo causa malos resultados, ya que muchas personas no saben mucho sobre el desentrelazado y no saben que la velocidad de cuadros es la mitad de la velocidad de campo. Muchos codecs/reproductores ni siquiera desentrelazan por sí mismos y dependen de la tarjeta gráfica y la API de aceleración de video para realizar el desentrelazado correctamente.

Preocupaciones sobre la eficacia

La Unión Europea de Radiodifusión se opuso al uso de vídeo entrelazado en la producción y la difusión, recomendando 720p 50 fps (fotogramas por segundo) como el formato de producción vigente en ese momento y trabajando con la industria para introducir 1080p 50 como un estándar de producción a prueba de futuro hasta principios de la década de 2010, que ofrecía una resolución vertical más alta, mejor calidad a tasas de bits más bajas y una conversión más fácil a otros formatos como 720p50 y 1080i50. [14] [15] El argumento principal fue que, sin importar cuán complejo sea el algoritmo de desentrelazado, los artefactos en la señal entrelazada no se pueden eliminar porque se pierde cierta información entre fotogramas.

Yves Faroudja, fundador de Faroudja Labs y ganador del premio Emmy por sus logros en tecnología de desentrelazado, afirmó que "el entrelazado a progresivo no funciona" y desaconsejó el uso de señales entrelazadas. [2] [16]

Véase también

Referencias

  1. ^ Jung, JH; Hong, SH (2011). "Método de desentrelazado basado en el refinamiento de la dirección de los bordes utilizando un filtro de frecuencia máxima ponderada". Actas de la 5.ª Conferencia internacional sobre gestión y comunicación de información ubicua . ACM. ISBN 978-1-4503-0571-6.
  2. ^ de Philip Laven (26 de enero de 2005). "EBU Technical Review No. 301 (January 2005)". EBU. Archivado desde el original el 16 de junio de 2006.
  3. ^ Patente estadounidense 4698675, Casey, Robert F., "Sistema de visualización de barrido progresivo con modos de proceso intracampo e intercampo", expedida el 6 de octubre de 1987, asignada a RCA Corporation 
  4. ^ PC Magazine. «Definición de PCMag: Desentrelazado». Archivado desde el original el 7 de octubre de 2012. Consultado el 26 de agosto de 2017 .
  5. ^ "Desafío de desentrelazado 2019".
  6. ^ ab "VEGAS Creative Software - Más rápido. Más creativo. Posibilidades infinitas". www.vegascreativesoftware.com .
  7. ^ "MSU Deinterlacer Benchmark". Archivado desde el original el 13 de febrero de 2021. Consultado el 24 de febrero de 2021 .
  8. ^ "VirtualDub MSU Desentrelazador / Ïëàãèí äëÿ äåèíòåðëåéñèíãà ïîä VirtualDub". compresión.ru .
  9. ^ "Descripción". GitHub . 13 de octubre de 2021.
  10. ^ "Dubhater/Vapoursynth-nnedi3". GitHub . 21 de octubre de 2021.
  11. ^ "Documentación de filtros FFmpeg".
  12. ^ "Descripción". GitHub . 24 de junio de 2021.
  13. ^ Zhu, Haichao; Liu, Xueting; Mao, Xiangyu; Wong, Tien Tsin (2017). "Desentrelazado de vídeo profundo en tiempo real". arXiv : 1708.00187 [cs.CV].
  14. ^ "EBU R115-2005: FUTURE HIGH DEFINITION TELEVISION SYSTEMS" (PDF) . EBU. Mayo de 2005. Archivado (PDF) desde el original el 26 de marzo de 2009 . Consultado el 24 de mayo de 2009 .
  15. ^ "10 cosas que debes saber sobre... 1080p/50" (PDF) . EBU. Septiembre de 2009. Consultado el 26 de junio de 2010 .
  16. ^ Philip Laven (25 de enero de 2005). "EBU Technical Review No. 300 (octubre de 2004)". EBU. Archivado desde el original el 7 de junio de 2011.

Enlaces externos