stringtranslate.com

Velocidad de cuadros

Velocidad de cuadros , expresada más comúnmente enLos cuadros por segundo oFPSson, por lo general, lafrecuencia(tasa) con la quese capturan o muestranimágenes(cuadroscámarasde ciney,animación por computadorayde captura de movimiento. En estos contextos, la velocidad de cuadros se puede usar indistintamente confrecuencia de cuadros yfrecuencia de actualización, que se expresan enhercios. Además, en el contexto del rendimiento de los gráficos de computadora, FPS es la velocidad a la que un sistema, particularmente unaGPU, es capaz de generar cuadros, y la frecuencia de actualización es la frecuencia a la que una pantalla muestra cuadros completos.[1]En las especificaciones de la cámara electrónica, la frecuencia de cuadros se refiere a la velocidad máxima posible a la que se pueden capturar cuadros, pero en la práctica, otras configuraciones (como el tiempo de exposición) pueden reducir la frecuencia real a un número menor que la frecuencia de cuadros.

Visión humana

La sensibilidad temporal y la resolución de la visión humana varían según el tipo y las características del estímulo visual, y difieren entre individuos. El sistema visual humano puede procesar de 10 a 12 imágenes por segundo y percibirlas individualmente, mientras que las tasas más altas se perciben como movimiento. [2] La luz modulada (como una pantalla de computadora ) es percibida como estable por la mayoría de los participantes en estudios cuando la tasa es superior a 50 Hz. Esta percepción de la luz modulada como constante se conoce como el umbral de fusión de parpadeo . Sin embargo, cuando la luz modulada no es uniforme y contiene una imagen, el umbral de fusión de parpadeo puede ser mucho más alto, en los cientos de hercios. [3] Con respecto al reconocimiento de imágenes , se ha descubierto que las personas reconocen una imagen específica en una serie ininterrumpida de imágenes diferentes, cada una de las cuales dura tan solo 13 milisegundos. [4] La persistencia de la visión a veces explica un estímulo visual muy corto de un solo milisegundo que tiene una duración percibida de entre 100 ms y 400 ms. A veces, estímulos múltiples que son muy breves se perciben como un único estímulo, como un destello de luz verde de 10 ms seguido inmediatamente por un destello de luz roja de 10 ms que se percibe como un único destello de luz amarilla. [5]

Cine y vídeo

Película muda

Las primeras películas mudas tenían velocidades de cuadro establecidas de entre 16 y 24 fotogramas por segundo (fps), [6] pero como las cámaras se accionaban manualmente, la velocidad a menudo cambiaba durante la escena para adaptarse al estado de ánimo. Los proyeccionistas también podían cambiar la velocidad de cuadro en el cine ajustando un reóstato que controlaba el voltaje que alimentaba el mecanismo portador de la película en el proyector . [7] Las compañías cinematográficas a menudo pretendían que los cines mostraran sus películas mudas a velocidades de cuadro más altas que las que utilizaban para filmarlas. [8] Estas velocidades de cuadro eran suficientes para la sensación de movimiento, pero se percibía como un movimiento espasmódico. Para minimizar el parpadeo percibido, los proyectores empleaban obturadores de doble y triple hoja , por lo que cada fotograma se mostraba dos o tres veces, lo que aumentaba la velocidad de parpadeo a 48 o 72 hercios y reducía la fatiga visual. Thomas Edison dijo que 46 fotogramas por segundo era el mínimo necesario para que el ojo perciba el movimiento: "Cualquier cosa menos cansará la vista". [9] [10] A mediados y finales de la década de 1920, la velocidad de cuadros de las películas mudas aumentó a 20-26 FPS. [9]

Película sonora

Cuando se introdujo el cine sonoro en 1926, las variaciones en la velocidad de la película ya no se toleraban, ya que el oído humano es más sensible que el ojo a los cambios de frecuencia. Muchos cines habían proyectado películas mudas a 22 a 26 FPS, por lo que la industria eligió 24 FPS para el cine sonoro como un compromiso. [11] De 1927 a 1930, a medida que varios estudios actualizaban el equipo, la velocidad de 24 FPS se convirtió en estándar para el cine sonoro de 35 mm. [2] A 24 FPS, la película viaja a través del proyector a una velocidad de 456 milímetros (18,0 pulgadas) por segundo. Esto permitió que los obturadores simples de dos hojas dieran una serie proyectada de imágenes a 48 por segundo, satisfaciendo la recomendación de Edison. Muchos proyectores de películas de 35 mm modernos utilizan obturadores de tres hojas para dar 72 imágenes por segundo: cada fotograma se muestra en la pantalla tres veces. [9]

Animación

Esta caricatura animada de un caballo al galope se muestra a 12 dibujos por segundo, y el movimiento rápido está al borde de ser objetablemente brusco.

En la animación dibujada , los personajes en movimiento suelen filmarse "en pares", es decir, se muestra un dibujo por cada dos fotogramas de la película (que normalmente se ejecuta a 24 fotogramas por segundo), lo que significa que solo hay 12 dibujos por segundo. [12] Aunque la tasa de actualización de la imagen es baja, la fluidez es satisfactoria para la mayoría de los sujetos. Sin embargo, cuando se requiere que un personaje realice un movimiento rápido, generalmente es necesario volver a animar "en uno", ya que los "dos" son demasiado lentos para transmitir el movimiento adecuadamente. Una combinación de las dos técnicas mantiene al ojo engañado sin un costo de producción innecesario. [13]

La mayoría de las animaciones de los " dibujos animados del sábado por la mañana " se producían de la forma más barata posible y, en la mayoría de los casos, se rodaban en "tres" o incluso "cuatro", es decir, tres o cuatro fotogramas por dibujo. Esto se traduce en tan solo 8 o 6 dibujos por segundo, respectivamente. El anime también suele dibujarse en tres o dos. [14] [15]

Estándares de vídeo modernos

Debido a la frecuencia de la red eléctrica, se desarrolló la transmisión de televisión analógica con frecuencias de cuadro de 50 Hz (la mayor parte del mundo) o 60 Hz (Canadá, EE. UU., México, Filipinas, Japón, Corea del Sur). La frecuencia de la red eléctrica era extremadamente estable y, por lo tanto, era lógico utilizarla para la sincronización.

La introducción de la tecnología de televisión en color hizo necesario reducir esa frecuencia de 60 FPS en un 0,1 % para evitar que el " punto de arrastre ", un artefacto de visualización que aparecía en las pantallas en blanco y negro antiguas, apareciera en superficies con una alta saturación de color. Se descubrió que al reducir la frecuencia de cuadros en un 0,1 %, se minimizaba el efecto no deseado.

A partir de 2021 , los estándares de transmisión de video en América del Norte, Japón y Corea del Sur todavía se basan en 60 / 1.001 ≈ 59.94 imágenes por segundo. Normalmente se utilizan dos tamaños de imágenes: 1920×1080 ("1080i/p") y 1280×720 ("720p"). De manera confusa, los formatos entrelazados se indican habitualmente a la mitad de su velocidad de imagen, 29,97/25 FPS y el doble de su altura de imagen, pero estas declaraciones son puramente personalizadas; en cada formato, se producen 60 imágenes por segundo. Una resolución de 1080i produce 59,94 o 50 imágenes de 1920×540, cada una comprimida a la mitad de su altura en el proceso fotográfico y estirada hacia atrás para llenar la pantalla durante la reproducción en un televisor. El formato 720p produce imágenes de 1280x720p de 59,94/50 o 29,97/25, sin compresión, por lo que no es necesario expandir ni comprimir la imagen. Esta confusión se extendió por toda la industria en los primeros días del software de video digital, ya que mucho software se escribía incorrectamente, ya que los desarrolladores creían que solo se esperaban 29,97 imágenes por segundo, lo cual era incorrecto. Si bien era cierto que cada elemento de la imagen se sondeaba y enviaba solo 29,97 veces por segundo, la ubicación del píxel inmediatamente inferior se sondeaba 1/60 de segundo después, como parte de una imagen completamente separada para el siguiente cuadro de 1/60 de segundo.

A su velocidad nativa de 24 FPS, la película no podría mostrarse en un video de 60 Hz sin el proceso de pulldown necesario , lo que a menudo provoca "vibraciones": para convertir 24 fotogramas por segundo en 60 fotogramas por segundo, cada fotograma impar se repite, reproduciéndose dos veces, mientras que cada fotograma par se triplica. Esto crea un movimiento desigual, que parece estroboscópico. Otras conversiones tienen una duplicación desigual de fotogramas similar. Los estándares de video más nuevos admiten 120, 240 o 300 fotogramas por segundo, por lo que los fotogramas se pueden muestrear de manera uniforme para velocidades de fotogramas estándar, como películas de 24, 48 y 60 FPS o videos de 25, 30, 50 o 60 FPS. Por supuesto, estas velocidades de fotogramas más altas también se pueden mostrar a sus velocidades nativas. [16] [17]

Especificaciones de la cámara electrónica

En las especificaciones de las cámaras electrónicas, la velocidad de cuadros se refiere a la máxima cantidad posible de cuadros que se pueden capturar (por ejemplo, si el tiempo de exposición se estableciera cerca de cero), pero en la práctica, otras configuraciones (como el tiempo de exposición) pueden reducir la frecuencia real a un número menor que la velocidad de cuadros. [18]

Conversión ascendente de velocidad de cuadros

La conversión ascendente de la frecuencia de cuadros (FRC) es el proceso de aumentar la resolución temporal de una secuencia de vídeo mediante la síntesis de uno o más cuadros intermedios entre dos cuadros consecutivos. Una frecuencia de cuadros baja provoca aliasing , produce artefactos de movimiento abruptos y degrada la calidad del vídeo. En consecuencia, la resolución temporal es un factor importante que afecta a la calidad del vídeo. Los algoritmos para FRC se utilizan ampliamente en aplicaciones que incluyen la mejora de la calidad visual, la compresión de vídeo y la generación de vídeo en cámara lenta.

Vídeo con baja velocidad de cuadros
Vídeo con una velocidad de cuadros 4 veces mayor

Métodos

La mayoría de los métodos FRC se pueden clasificar en métodos basados ​​en flujo óptico o kernel [19] [20] y métodos basados ​​en alucinación de píxeles. [21] [22]

FRC basado en flujo

Los métodos basados ​​en flujo combinan linealmente los flujos ópticos predichos entre dos fotogramas de entrada para aproximar los flujos desde el fotograma intermedio de destino hasta los fotogramas de entrada. También proponen la inversión del flujo (proyección) para lograr una deformación de la imagen más precisa . Además, existen algoritmos que otorgan diferentes pesos a los vectores de flujo superpuestos según la profundidad del objeto de la escena a través de una capa de proyección de flujo.

FRC basado en alucinaciones de píxeles

Los métodos basados ​​en alucinaciones de píxeles utilizan una convolución deformable para generar el cuadro central mediante la sustitución de flujos ópticos por vectores de desplazamiento. Existen algoritmos que también interpolan cuadros intermedios con la ayuda de una convolución deformable en el dominio de características. Sin embargo, dado que estos métodos alucinan directamente los píxeles a diferencia de los métodos FRC basados ​​en flujos, los cuadros predichos tienden a ser borrosos cuando hay objetos que se mueven rápidamente.

Véase también

Referencias

  1. ^ Tamasi, Tony (3 de diciembre de 2019). "¿Qué es la velocidad de cuadros y por qué es importante para los juegos de PC?" . Consultado el 12 de febrero de 2023 .
  2. ^ ab Read, Paul; Meyer, Mark-Paul; Gamma Group (2000). Restauración de películas cinematográficas. Conservación y museología. Butterworth-Heinemann. págs. 24-26. ISBN 978-0-7506-2793-1.
  3. ^ James Davis (1986), "Los humanos perciben artefactos de parpadeo a 500 Hz", Sci. Rep. , 5 : 7861, doi :10.1038/srep07861, PMC 4314649 , PMID  25644611 
  4. ^ Potter, Mary C. (28 de diciembre de 2013). "Detección de significado en RSVP a 13 ms por imagen" (PDF) . Atención, percepción y psicofísica . 76 (2): 270–279. doi :10.3758/s13414-013-0605-z. hdl : 1721.1/107157 . PMID  24374558. S2CID  180862. Archivado (PDF) desde el original el 2022-10-09.
  5. ^ Robert Efron (1973). «Conservación de información temporal por sistemas perceptuales». Percepción y psicofísica . 14 (3): 518–530. doi : 10.3758/bf03211193 .
  6. ^ Brown, Julie (2014). "Palimpsestos audiovisuales: resincronización de películas mudas con música 'especial'". En David Neumeyer (ed.). The Oxford Handbook of Film Music Studies . Oxford University Press. pág. 588. ISBN 978-0195328493.
  7. ^ Kerr, Walter (1975). Payasos silenciosos . Knopf. pág. 36. ISBN 978-0394469072.
  8. ^ Card, James (1994). Cine seductor: el arte del cine mudo . Knopf. p. 53. ISBN 978-0394572185.
  9. ^ abc Brownlow, Kevin (verano de 1980). "Silent Films: What Was the Right Speed?" [Películas mudas: ¿cuál era la velocidad adecuada?]. Sight & Sound . 49 (3): 164–167. Archivado desde el original el 8 de julio de 2011 . Consultado el 2 de mayo de 2012 .
  10. ^ Elsaesser, Thomas; Barker, Adam (1990). Cine primitivo: espacio, marco, narrativa . BFI Publishing. p. 284. ISBN. 978-0-85170-244-5.
  11. ^ TWiT Netcast Network (30 de marzo de 2017), Cómo los 24 FPS se convirtieron en estándar, archivado desde el original el 4 de noviembre de 2021 , consultado el 31 de marzo de 2017
  12. ^ Chew, Johnny. "¿Qué son los unos, los dos y los tres en la animación?". Lifewire . Consultado el 8 de agosto de 2018 .
  13. ^ Whitaker, Harold; Sito, John Halas; actualizado por Tim (2009). Timing for animation (2.ª ed.). Ámsterdam: Elsevier/Focal Press. pág. 52. ISBN 978-0240521602. Recuperado el 8 de agosto de 2018 .{{cite book}}: CS1 maint: varios nombres: lista de autores ( enlace )
  14. ^ "Disparos en tríos (unos, dos, etc.)". Anime News Network .
  15. ^ CLIP STUDIO (12 de febrero de 2016). "CLIP STUDIO PAINT ア ニ メ ー シ ョ ン 機 能 の 使 い 方". Archivado desde el original el 4 de noviembre de 2021, a través de YouTube.
  16. ^ Televisión de alta velocidad de cuadros, Libro blanco de la BBC WHP 169, septiembre de 2008, M. Armstrong, D. Flynn, M. Hammond, PAWAN Jahajpuria S. Jolly, R. Salmon.
  17. ^ Jon Fingas (27 de noviembre de 2014), "Las secuelas de 'Avatar' de James Cameron se ceñirán a 48 fotogramas por segundo", Engadget , consultado el 15 de abril de 2017
  18. ^ Whaley, Sean (21 de noviembre de 2018). "¿Qué es la velocidad de cuadros y por qué es importante para los juegos de PC?" . Consultado el 5 de agosto de 2021 .
  19. ^ Simon, Niklaus; Long, Mai; Feng, Liu (2017). Interpolación de fotogramas de vídeo mediante convolución separable adaptativa . ICCV. arXiv : 1708.01692 .
  20. ^ Huaizu, Jiang; Deqing, Sun; Varun, Jampani; Ming-Hsuan, Yang; Erik, Learned-Miller; Jan, Kautz (2018). Super slomo: estimación de alta calidad de múltiples cuadros intermedios para interpolación de video . ICCV. arXiv : 1712.00080 .
  21. ^ Shurui, Gui; Chaoyue, Wang; Qihua, Chen; Dacheng, Tao (2020). "Featureflow: interpolación de video robusta a través de la generación de estructura a textura". Conferencia IEEE/CVF 2020 sobre visión artificial y reconocimiento de patrones (CVPR) . IEEE. págs. 14001–14010. doi :10.1109/CVPR42600.2020.01402. ISBN . 978-1-7281-7169-2.
  22. ^ Myungsub, Choi; Heewon, Kim; Bohyung, Han; Ning, Xu; Kyoung, Mu Lee (2020). "La atención del canal es todo lo que necesita para la interpolación de fotogramas de vídeo". Actas de la Conferencia AAAI sobre Inteligencia Artificial . 34 (7). AAAI: 10663–10671. doi : 10.1609/aaai.v34i07.6693 .

Enlaces externos

( Copia de Wayback Machine )