stringtranslate.com

Desentrelazado

El desentrelazado es el proceso de convertir un vídeo entrelazado en una forma progresiva o no entrelazada . Las señales de video entrelazadas se encuentran comúnmente en televisión analógica , VHS , Laserdisc , televisión digital ( HDTV ) en formato 1080i , algunos títulos de DVD y una cantidad menor de discos Blu-ray .

Un fotograma de vídeo entrelazado consta de dos campos tomados en secuencia: el primero contiene todas las líneas impares de la imagen y el segundo, todas las líneas pares. La televisión analógica empleó esta técnica porque permitía un menor ancho de banda de transmisión y al mismo tiempo mantenía una alta velocidad de fotogramas para un movimiento más suave y realista. Una señal no entrelazada (o de escaneo progresivo ) que utiliza el mismo ancho de banda solo actualiza la pantalla con la mitad de frecuencia y se descubrió que genera un parpadeo o tartamudeo percibido. Las pantallas basadas en CRT pudieron mostrar video entrelazado correctamente debido a su naturaleza completamente analógica, fusionando las líneas alternas a la perfección. Sin embargo, desde principios de la década de 2000, pantallas como televisores y monitores de computadora se han vuelto casi completamente digitales (en el sentido de que la pantalla está compuesta de píxeles discretos) y en tales pantallas el entrelazado se vuelve notable y puede aparecer como un defecto visual que distrae. El proceso de desentrelazado debería intentar minimizarlos.

Por lo tanto, el desentrelazado es un proceso necesario y viene integrado en la mayoría de los reproductores de DVD, reproductores de Blu-ray, televisores LCD/LED, proyectores digitales, descodificadores de TV, equipos de transmisión profesionales y reproductores y editores de vídeo por computadora modernos, aunque cada uno de ellos con distintos niveles de calidad.

El desentrelazado se ha investigado durante décadas y emplea complejos algoritmos de procesamiento; sin embargo, ha sido muy difícil lograr resultados consistentes. [1] [2]

Fondo

Ejemplo de vídeo entrelazado (ralentizado)

Tanto el vídeo como la película fotográfica capturan una serie de fotogramas (imágenes fijas) en rápida sucesión; sin embargo, los sistemas de televisión leen la imagen capturada escaneando en serie el sensor de imagen por líneas (filas). En la televisión analógica, cada cuadro se divide en dos campos consecutivos , uno que contiene todas las líneas pares y otro con las impares. Los campos se capturan en sucesión a una velocidad dos veces mayor que la velocidad de fotogramas nominal. Por ejemplo, los sistemas PAL y SECAM tienen una velocidad de 25 fotogramas/s o 50 campos/s, mientras que el sistema NTSC ofrece 29,97 fotogramas/s o 59,94 campos/s. Este proceso de dividir fotogramas en campos de media resolución al doble de velocidad de fotogramas se conoce como entrelazado .

Dado que la señal entrelazada contiene los dos campos de un fotograma de vídeo filmado en dos momentos diferentes, mejora la percepción del movimiento para el espectador y reduce el parpadeo aprovechando la persistencia del efecto de visión. Esto da como resultado una duplicación efectiva de la resolución de tiempo en comparación con el metraje no entrelazado (para velocidades de fotogramas iguales a las velocidades de campo). Sin embargo, la señal entrelazada requiere una pantalla que sea capaz de mostrar de forma nativa los campos individuales en orden secuencial, y sólo los televisores tradicionales basados ​​en CRT son capaces de mostrar la señal entrelazada, debido al escaneo electrónico y a la falta de una resolución fija aparente.

La mayoría de las pantallas modernas, como las LCD , DLP y plasma , no pueden funcionar en modo entrelazado porque son pantallas de resolución fija y solo admiten escaneo progresivo. Para mostrar una señal entrelazada en dichas pantallas, los dos campos entrelazados deben convertirse en un cuadro progresivo con un proceso conocido como desentrelazado . Sin embargo, cuando los dos campos tomados en diferentes momentos se vuelven a combinar en un fotograma completo mostrado a la vez, se producen defectos visuales llamados artefactos de entrelazado o combinación con los objetos en movimiento en la imagen. Un buen algoritmo de desentrelazado debería intentar evitar artefactos de entrelazado tanto como sea posible y no sacrificar la calidad de la imagen en el proceso, lo cual es difícil de lograr de manera consistente. Hay varias técnicas disponibles que extrapolan la información de la imagen que falta; sin embargo, caen en la categoría de creación inteligente de cuadros y requieren algoritmos complejos y una potencia de procesamiento sustancial.

Las técnicas de desentrelazado requieren un procesamiento complejo y, por tanto, pueden introducir un retraso en la transmisión de vídeo. Si bien generalmente no se nota, esto puede provocar que la visualización de videojuegos más antiguos quede rezagada con respecto a la entrada del controlador. Por tanto, muchos televisores tienen un "modo de juego" en el que se realiza un procesamiento mínimo para maximizar la velocidad a expensas de la calidad de la imagen. El desentrelazado es sólo parcialmente responsable de dicho retraso; El escalado también implica algoritmos complejos que tardan milisegundos en ejecutarse.

Material de origen progresivo

Es posible que algunos videos entrelazados se hayan creado originalmente a partir de metraje progresivo, y el proceso de desentrelazado también debe considerar esto.

El material cinematográfico típico se graba en película de 24 fotogramas/s. La conversión de películas a videos entrelazados generalmente utiliza un proceso llamado telecine mediante el cual cada cuadro se convierte en múltiples campos. En algunos casos, cada fotograma de la película se puede presentar mediante exactamente dos fotogramas segmentados progresivos (PsF), y en este formato no requiere un algoritmo de desentrelazado complejo porque cada campo contiene una parte del mismo fotograma progresivo. Sin embargo, para igualar la señal PAL/SECAM entrelazada de 50 campos o NTSC entrelazada de 59,94/60 campos, es necesaria la conversión de la velocidad de fotogramas utilizando varias técnicas "pulldown". La mayoría de los televisores avanzados pueden restaurar la señal original de 24 fotogramas mediante un proceso de telecine inverso . Otra opción es acelerar la película de 24 fotogramas en un 4% (a 25 fotogramas/s) para la conversión PAL/SECAM; Este método todavía se utiliza ampliamente para DVD, así como para transmisiones de televisión (SD y HD) en los mercados PAL.

Los DVD pueden codificar películas utilizando uno de estos métodos o almacenar vídeo progresivo original de 24 fotogramas y utilizar etiquetas decodificadoras MPEG-2 para indicar al reproductor de vídeo cómo convertirlos al formato entrelazado. La mayoría de las películas en Blu-ray han conservado la velocidad de película en movimiento original no entrelazada de 24 fotogramas por segundo y permiten la salida en formato progresivo 1080p24 directamente a dispositivos de visualización, sin necesidad de conversión.

Algunas videocámaras HDV 1080i también ofrecen el modo PsF con velocidades de cuadro similares a las del cine de 24 o 25 cuadros/s. Los equipos de producción de televisión también pueden utilizar cámaras de película especiales que funcionan a 25 o 30 cuadros por segundo, cuando dicho material no necesita conversión de velocidad de cuadros para transmitir en el formato del sistema de video previsto.

Métodos de desentrelazado

Cuando alguien mira un vídeo entrelazado en un monitor progresivo con un desentrelazado deficiente, puede ver un "peinado" en movimiento entre dos campos de un fotograma.

El desentrelazado requiere que la pantalla almacene en buffer uno o más campos y los recombine en fotogramas completos. En teoría, esto sería tan simple como capturar un campo y combinarlo con el siguiente campo a recibir, produciendo un solo cuadro. Sin embargo, la señal grabada originalmente se produjo a partir de dos campos en diferentes momentos y, sin un procesamiento especial, cualquier movimiento a través de los campos generalmente resulta en un efecto de "peinado" donde las líneas alternas se desplazan ligeramente entre sí.

Existen varios métodos para desentrelazar vídeo, cada uno de los cuales produce diferentes problemas o artefactos propios. Algunos métodos son mucho más limpios en los artefactos que otros métodos.

La mayoría de las técnicas de desentrelazado se dividen en tres grandes grupos:

  1. Desentrelazado de combinación de campos que toma los campos pares e impares y los combina en un solo cuadro. Esto reduce a la mitad la velocidad de fotogramas percibida (la resolución temporal), por lo que 50i o 60i se convierte a 25p o 30p.
  2. Desentrelazado de extensión de campo que toma cada campo (con solo la mitad de las líneas) y lo extiende a toda la pantalla para formar un marco. Esto reduce a la mitad la resolución vertical de la imagen pero mantiene la velocidad de campo original (50i o 60i se convierte a 50p o 60p).
  3. Desentrelazado de compensación de movimiento que utiliza algoritmos más avanzados para detectar movimiento a través de campos, cambiando técnicas cuando es necesario. Esto produce el resultado de mejor calidad, pero requiere la mayor potencia de procesamiento.

Por lo tanto, los sistemas de desentrelazado modernos amortiguan varios campos y utilizan técnicas como la detección de bordes en un intento de encontrar el movimiento entre los campos. Luego se utiliza para interpolar las líneas que faltan del campo original, reduciendo el efecto de combinación. [3]

Desentrelazado de combinación de campos

Estos métodos toman los campos pares e impares y los combinan en un solo cuadro. Conservan la resolución vertical completa a expensas de la resolución temporal (velocidad de fotogramas percibida), por lo que 50i/60i se convierte a 24p/25p/30p, lo que puede perder la sensación suave y fluida del original. Sin embargo, si la señal entrelazada se produjo originalmente a partir de una fuente de velocidad de cuadros más baja, como una película, entonces no se pierde información y estos métodos pueden ser suficientes.

Costura
Mezcla

Desentrelazado de extensión de campo

Estos métodos toman cada campo (con solo la mitad de las líneas) y lo extienden a toda la pantalla para crear un marco. Esto puede reducir a la mitad la resolución vertical de la imagen, pero tiene como objetivo mantener la velocidad de campo original (50i o 60i se convierte a 50p o 60p).

Media talla
Duplicación de línea

La duplicación de líneas a veces se confunde con el desentrelazado en general, o con la interpolación (escalado de imagen) que utiliza filtrado espacial para generar líneas adicionales y, por tanto, reducir la visibilidad de la pixelación en cualquier tipo de pantalla. [4] La terminología 'duplicador de línea' se usa con mayor frecuencia en la electrónica de consumo de alta gama, mientras que 'desentrelazado' se usa con más frecuencia en el ámbito de las computadoras y el video digital.

Desentrelazado de compensación de movimiento

Los algoritmos de desentrelazado más avanzados combinan los métodos tradicionales de combinación de campos (tejido y combinación) y métodos de extensión de fotogramas (bob o duplicación de líneas) para crear una secuencia de vídeo progresiva de alta calidad. Una de las pistas básicas sobre la dirección y cantidad del movimiento sería la dirección y longitud de los artefactos combinados en la señal entrelazada.

Los mejores algoritmos también intentan predecir la dirección y la cantidad de movimiento de la imagen entre campos posteriores para combinar mejor los dos campos. Pueden emplear algoritmos similares a la compensación de movimiento en bloque utilizados en la compresión de vídeo. Por ejemplo, si dos campos tuvieran la cara de una persona moviéndose hacia la izquierda, el tejido crearía peinados y la combinación crearía imágenes fantasma. La compensación de movimiento avanzada (idealmente) vería que la cara en varios campos es la misma imagen, solo que se mueve a una posición diferente, e intentaría detectar la dirección y la cantidad de dicho movimiento. Luego, el algoritmo intentaría reconstruir todos los detalles de la cara en ambos cuadros de salida combinando las imágenes, moviendo partes de cada campo a lo largo de la dirección detectada según la cantidad de movimiento detectada. Los desentrelazadores que utilizan esta técnica suelen ser superiores porque pueden utilizar información de muchos campos, en lugar de sólo uno o dos; sin embargo, requieren un hardware potente para lograrlo en tiempo real.

La compensación de movimiento debe combinarse con la detección de cambio de escena (que tiene sus propios desafíos); de lo contrario, intentará encontrar movimiento entre dos escenas completamente diferentes. Un algoritmo de compensación de movimiento mal implementado interferiría con el movimiento natural y podría dar lugar a artefactos visuales que se manifiestan como partes "saltando" en lo que debería ser una imagen estacionaria o en movimiento suave.

Medición de calidad

Los diferentes métodos de desentrelazado tienen diferentes características de calidad y velocidad.

Generalmente, para medir la calidad del método de desentrelazado, se utiliza el siguiente enfoque:

  1. Se compone de un conjunto de vídeos progresivos.
  2. Todos estos videos están entrelazados.
  3. Cada uno de los videos entrelazados se desentrelaza con un método de desentrelazado específico
  4. Todos los videos desentrelazados se comparan con el video fuente correspondiente mediante una métrica de calidad de video objetiva, como PSNR , SSIM o VMAF .

La principal métrica de medición de la velocidad son los fotogramas por segundo (FPS) : cuántos fotogramas el desentrelazador puede procesar por segundo. Hablando de FPS, es necesario especificar la resolución de todos los cuadros y las características del hardware, porque la velocidad de un método de desentrelazado específico depende significativamente de estos dos factores.

Puntos de referencia

Reto Desentrelazado 2019

Este punto de referencia ha comparado 8 métodos diferentes de desentrelazado en un vídeo sintético. Hay una curva de Lissajous tridimensional en movimiento en el video para hacerlo desafiante para los métodos modernos de desentrelazado. Los autores utilizaron MSE y PSNR como métricas objetivas. Además, miden la velocidad de procesamiento en FPS . Para algunos métodos sólo hay comparación visual, para otros, sólo objetiva. [5]

Punto de referencia del desentrelazador de MSU

Este punto de referencia ha comparado más de 20 métodos en 40 secuencias de vídeo. La longitud total de las secuencias es de 834 fotogramas. Sus autores afirman que la característica principal de este punto de referencia es la comparación exhaustiva de métodos con herramientas de comparación visual, gráficos de rendimiento y ajuste de parámetros. Los autores utilizaron PSNR y SSIM como métricas objetivas. [7]

El autor de VapourSynth TDeintMod afirma que es un desentrelazador adaptativo de movimiento bidireccional. El método NNEDI utiliza una red neuronal para desentrelazar secuencias de vídeo. FFmpeg Bob Weaver Deinterlacing Filter es parte de un marco conocido para el procesamiento de video y audio. Vapoursynth EEDI3 es la abreviatura de "interpolación dirigida de borde mejorada 3", los autores de este método afirman que funciona encontrando la mejor deformación no decreciente entre dos líneas de acuerdo con un costo funcional. Los autores de Real-Time Deep Video Deinterlacer utilizan Deep CNN para obtener la mejor calidad de vídeo de salida.

Donde se realiza el desentrelazado

El desentrelazado de una señal de vídeo entrelazada se puede realizar en varios puntos de la cadena de producción de televisión.

Medios progresistas

El desentrelazado es necesario para programas de archivo entrelazados cuando el formato de transmisión o el formato de medios es progresivo, como en la transmisión EDTV 576p o HDTV 720p50, o la transmisión móvil DVB-H; Hay dos maneras de lograrlo.

medios entrelazados

Cuando el formato de transmisión o el formato multimedia está entrelazado, el desentrelazado en tiempo real debe realizarse mediante circuitos integrados en un decodificador, televisor, procesador de video externo, reproductor de DVD o DVR o tarjeta sintonizadora de TV. Dado que los equipos de electrónica de consumo suelen ser mucho más baratos, tienen considerablemente menos potencia de procesamiento y utilizan algoritmos más simples en comparación con los equipos de desentrelazado profesionales, la calidad del desentrelazado puede variar ampliamente y los resultados típicos suelen ser deficientes incluso en equipos de alta gama. [ cita necesaria ]

El uso de una computadora para reproducción y/o procesamiento permite potencialmente una elección más amplia de reproductores de video y/o software de edición que no se limita a la calidad ofrecida por el dispositivo electrónico de consumo integrado, por lo que al menos teóricamente es posible una mayor calidad de desentrelazado, especialmente si el usuario puede preconversión de vídeo entrelazado a escaneo progresivo antes de la reproducción y algoritmos de desentrelazado avanzados y que consumen mucho tiempo (es decir, empleando el método de "producción").

Sin embargo, la calidad del software de consumo, tanto gratuito como comercial, puede no estar a la altura del software y equipo profesionales. Además, la mayoría de los usuarios no están capacitados en producción de videos; Esto a menudo causa malos resultados ya que muchas personas no saben mucho sobre desentrelazado y no son conscientes de que la velocidad de fotogramas es la mitad de la velocidad de campo. Muchos códecs/reproductores ni siquiera se desentrelazan por sí mismos y dependen de la tarjeta gráfica y la API de aceleración de video para realizar un desentrelazado adecuado.

Preocupaciones sobre la eficacia

La Unión Europea de Radiodifusión se ha opuesto al uso de vídeo entrelazado en la producción y la radiodifusión, recomendando 720p 50 fps (cuadros por segundo) como formato de producción actual y trabajando con la industria para introducir 1080p 50 como estándar de producción preparado para el futuro que ofrece mayor verticalidad. resolución, mejor calidad a velocidades de bits más bajas y conversión más sencilla a otros formatos como 720p50 y 1080i50. [14] [15] El argumento principal es que no importa cuán complejo pueda ser el algoritmo de desentrelazado, los artefactos en la señal entrelazada no se pueden eliminar porque parte de la información se pierde entre cuadros.

Yves Faroudja, fundador de Faroudja Labs y ganador del premio Emmy por sus logros en la tecnología de desentrelazado, afirmó que "el entrelazado a progresivo no funciona" y desaconsejó el uso de señales entrelazadas. [2] [16]

Ver también

Referencias

  1. ^ Jung, JH; Hong, SH (2011). "Método de desentrelazado basado en el refinamiento de la dirección del borde utilizando un filtro frecuente máximo ponderado". Actas de la V Conferencia Internacional sobre Gestión y Comunicación de Información Ubicua . ACM. ISBN 978-1-4503-0571-6.
  2. ^ ab Philip Laven (26 de enero de 2005). "Revisión técnica de la UER nº 301 (enero de 2005)". UER. Archivado desde el original el 16 de junio de 2006.
  3. ^ Patente estadounidense 4698675, Casey, Robert F., "Sistema de visualización de escaneo progresivo con modos de proceso dentro y entre campos", expedida el 6 de octubre de 1987, asignada a RCA Corporation 
  4. ^ Revista PC. "Definición de PCMag: desentrelazado". Archivado desde el original el 7 de octubre de 2012 . Consultado el 26 de agosto de 2017 .
  5. ^ "Desafío de desentrelazado 2019".
  6. ^ ab "Software creativo VEGAS: más rápido. Más creativo. Posibilidades infinitas". www.vegascreativesoftware.com .
  7. ^ "Parámetro de referencia del desentrelazador de MSU". Archivado desde el original el 13 de febrero de 2021 . Consultado el 24 de febrero de 2021 .
  8. ^ "VirtualDub MSU Desentrelazador / Ïëàãèí äëÿ äåèíòåðëåéñèíãà ïîä VirtualDub". compresión.ru .
  9. ^ "Descripción". GitHub . 13 de octubre de 2021.
  10. ^ "Dubhater/Vapoursynth-nnedi3". GitHub . 21 de octubre de 2021.
  11. ^ "Documentación de filtros FFmpeg".
  12. ^ "Descripción". GitHub . 24 de junio de 2021.
  13. ^ Zhu, Haichao; Liu, Xueting; Mao, Xiangyu; Wong, Tien Tsin (2017). "Desentrelazado de vídeo profundo en tiempo real". arXiv : 1708.00187 [cs.CV].
  14. ^ "EBU R115-2005: FUTUROS SISTEMAS DE TELEVISIÓN DE ALTA DEFINICIÓN" (PDF) . UER. Mayo de 2005. Archivado (PDF) desde el original el 26 de marzo de 2009 . Consultado el 24 de mayo de 2009 .
  15. ^ "Diez cosas que debes saber sobre... 1080p/50" (PDF) . UER. Septiembre de 2009 . Consultado el 26 de junio de 2010 .
  16. ^ Philip Laven (25 de enero de 2005). "Revista técnica de la UER nº 300 (octubre de 2004)". UER. Archivado desde el original el 7 de junio de 2011.

enlaces externos