Velocidad de cuadros , expresada más comúnmente enLos cuadros por segundo oFPSson, por lo general, lafrecuencia(tasa) con la quese capturan o muestranimágenes(cuadroscámarasde ciney,animación por computadorayde captura de movimiento. En estos contextos, la velocidad de cuadros se puede usar indistintamente confrecuencia de cuadros yfrecuencia de actualización, que se expresan enhercios. Además, en el contexto del rendimiento de los gráficos de computadora, FPS es la velocidad a la que un sistema, particularmente unaGPU, es capaz de generar cuadros, y la frecuencia de actualización es la frecuencia a la que una pantalla muestra cuadros completos.[1]En las especificaciones de la cámara electrónica, la frecuencia de cuadros se refiere a la velocidad máxima posible a la que se pueden capturar cuadros, pero en la práctica, otras configuraciones (como el tiempo de exposición) pueden reducir la frecuencia real a un número menor que la frecuencia de cuadros.
La sensibilidad temporal y la resolución de la visión humana varían según el tipo y las características del estímulo visual, y difieren entre individuos. El sistema visual humano puede procesar de 10 a 12 imágenes por segundo y percibirlas individualmente, mientras que las tasas más altas se perciben como movimiento. [2] La luz modulada (como una pantalla de computadora ) es percibida como estable por la mayoría de los participantes en estudios cuando la tasa es superior a 50 Hz. Esta percepción de la luz modulada como constante se conoce como el umbral de fusión de parpadeo . Sin embargo, cuando la luz modulada no es uniforme y contiene una imagen, el umbral de fusión de parpadeo puede ser mucho más alto, en los cientos de hercios. [3] Con respecto al reconocimiento de imágenes , se ha descubierto que las personas reconocen una imagen específica en una serie ininterrumpida de imágenes diferentes, cada una de las cuales dura tan solo 13 milisegundos. [4] La persistencia de la visión a veces explica un estímulo visual muy corto de un solo milisegundo que tiene una duración percibida de entre 100 ms y 400 ms. A veces, múltiples estímulos muy breves se perciben como un único estímulo, como un destello de luz verde de 10 ms seguido inmediatamente por un destello de luz roja de 10 ms que se percibe como un único destello de luz amarilla. [5]
Las primeras películas mudas tenían velocidades de cuadro establecidas de entre 16 y 24 fotogramas por segundo (fps), [6] pero como las cámaras se accionaban manualmente, la velocidad a menudo cambiaba durante la escena para adaptarse al estado de ánimo. Los proyeccionistas también podían cambiar la velocidad de cuadro en el cine ajustando un reóstato que controlaba el voltaje que alimentaba el mecanismo portador de la película en el proyector . [7] Las compañías cinematográficas a menudo pretendían que los cines mostraran sus películas mudas a velocidades de cuadro más altas que las que utilizaban para filmarlas. [8] Estas velocidades de cuadro eran suficientes para la sensación de movimiento, pero se percibía como un movimiento espasmódico. Para minimizar el parpadeo percibido, los proyectores empleaban obturadores de doble y triple hoja , por lo que cada fotograma se mostraba dos o tres veces, lo que aumentaba la velocidad de parpadeo a 48 o 72 hercios y reducía la fatiga visual. Thomas Edison dijo que 46 fotogramas por segundo era el mínimo necesario para que el ojo perciba el movimiento: "Cualquier cosa menos cansará la vista". [9] [10] A mediados y finales de la década de 1920, la velocidad de cuadros de las películas mudas aumentó a 20-26 FPS. [9]
Cuando se introdujo el cine sonoro en 1926, las variaciones en la velocidad de la película ya no se toleraban, ya que el oído humano es más sensible que el ojo a los cambios de frecuencia. Muchos cines habían proyectado películas mudas a 22 a 26 FPS, por lo que la industria eligió 24 FPS para el cine sonoro como un compromiso. [11] De 1927 a 1930, a medida que varios estudios actualizaban el equipo, la velocidad de 24 FPS se convirtió en estándar para el cine sonoro de 35 mm. [2] A 24 FPS, la película viaja a través del proyector a una velocidad de 456 milímetros (18,0 pulgadas) por segundo. Esto permitió que los obturadores simples de dos hojas dieran una serie proyectada de imágenes a 48 por segundo, satisfaciendo la recomendación de Edison. Muchos proyectores de películas de 35 mm modernos utilizan obturadores de tres hojas para dar 72 imágenes por segundo: cada fotograma se muestra en la pantalla tres veces. [9]
En la animación dibujada , los personajes en movimiento suelen filmarse "en pares", es decir, se muestra un dibujo por cada dos fotogramas de la película (que normalmente se ejecuta a 24 fotogramas por segundo), lo que significa que solo hay 12 dibujos por segundo. [12] Aunque la tasa de actualización de la imagen es baja, la fluidez es satisfactoria para la mayoría de los sujetos. Sin embargo, cuando se requiere que un personaje realice un movimiento rápido, generalmente es necesario volver a animar "en uno", ya que los "dos" son demasiado lentos para transmitir el movimiento adecuadamente. Una combinación de las dos técnicas mantiene al ojo engañado sin un costo de producción innecesario. [13]
La mayoría de las animaciones de los " dibujos animados del sábado por la mañana " se producían de la forma más barata posible y se rodaban en "tres" o incluso "cuatro", es decir, tres o cuatro fotogramas por dibujo. Esto se traduce en tan solo 8 o 6 dibujos por segundo respectivamente. El anime también suele dibujarse en tres o dos. [14] [15]
Debido a la frecuencia de la red eléctrica, se desarrolló la transmisión de televisión analógica con frecuencias de cuadro de 50 Hz (la mayor parte del mundo) o 60 Hz (Canadá, EE. UU., México, Filipinas, Japón, Corea del Sur). La frecuencia de la red eléctrica era extremadamente estable y, por lo tanto, era lógico utilizarla para la sincronización.
La introducción de la tecnología de televisión en color hizo necesario reducir esa frecuencia de 60 FPS en un 0,1 % para evitar que el " punto de arrastre ", un artefacto de visualización que aparecía en las pantallas en blanco y negro antiguas, apareciera en superficies con una alta saturación de color. Se descubrió que al reducir la frecuencia de cuadros en un 0,1 %, se minimizaba el efecto no deseado.
A partir de 2021 [actualizar], los estándares de transmisión de video en América del Norte, Japón y Corea del Sur todavía se basan en 60 / 1.001 ≈ 59.94 imágenes por segundo. Normalmente se utilizan dos tamaños de imágenes: 1920×1080 ("1080i/p") y 1280×720 ("720p"). De manera confusa, los formatos entrelazados se indican habitualmente a la mitad de su velocidad de imagen, 29,97/25 FPS y el doble de su altura de imagen, pero estas declaraciones son puramente personalizadas; en cada formato, se producen 60 imágenes por segundo. Una resolución de 1080i produce 59,94 o 50 imágenes de 1920×540, cada una comprimida a la mitad de su altura en el proceso fotográfico y estirada hacia atrás para llenar la pantalla durante la reproducción en un televisor. El formato 720p produce imágenes de 1280x720p de 59,94/50 o 29,97/25, sin compresión, por lo que no es necesario expandir ni comprimir la imagen. Esta confusión se extendió por toda la industria en los primeros días del software de video digital, ya que mucho software se escribía incorrectamente, ya que los desarrolladores creían que solo se esperaban 29,97 imágenes por segundo, lo cual era incorrecto. Si bien era cierto que cada elemento de la imagen se sondeaba y enviaba solo 29,97 veces por segundo, la ubicación del píxel inmediatamente inferior se sondeaba 1/60 de segundo después, como parte de una imagen completamente separada para el siguiente cuadro de 1/60 de segundo.
A su velocidad nativa de 24 FPS, la película no podría mostrarse en un video de 60 Hz sin el proceso de pulldown necesario , lo que a menudo provoca "vibraciones": para convertir 24 fotogramas por segundo en 60 fotogramas por segundo, cada fotograma impar se repite, reproduciéndose dos veces, mientras que cada fotograma par se triplica. Esto crea un movimiento desigual, que parece estroboscópico. Otras conversiones tienen una duplicación desigual de fotogramas similar. Los estándares de video más nuevos admiten 120, 240 o 300 fotogramas por segundo, por lo que los fotogramas se pueden muestrear de manera uniforme para velocidades de fotogramas estándar, como películas de 24, 48 y 60 FPS o videos de 25, 30, 50 o 60 FPS. Por supuesto, estas velocidades de fotogramas más altas también se pueden mostrar a sus velocidades nativas. [16] [17]
En las especificaciones de las cámaras electrónicas, la frecuencia de cuadros se refiere a la máxima cantidad posible de cuadros que se pueden capturar (por ejemplo, si el tiempo de exposición se estableciera cerca de cero), pero en la práctica, otras configuraciones (como el tiempo de exposición) pueden reducir la frecuencia real a un número menor que la frecuencia de cuadros. [18]
En los videojuegos de computadora , la velocidad de cuadros juega un papel importante en la experiencia ya que, a diferencia de las películas, los juegos se renderizan en tiempo real . 60 cuadros por segundo se ha considerado durante mucho tiempo la velocidad de cuadros "óptima" para un juego animado y fluido. [19] Los videojuegos diseñados para los mercados PAL , antes de la sexta generación de consolas de videojuegos , tenían velocidades de cuadros más bajas por diseño debido a la salida de 50 Hz. Esto hizo que los juegos de ritmo rápido, como los de carreras o de lucha, se ejecutaran notablemente más lento. [20]
La conversión ascendente de la frecuencia de cuadros (FRC) es el proceso de aumentar la resolución temporal de una secuencia de vídeo mediante la síntesis de uno o más cuadros intermedios entre dos cuadros consecutivos. Una frecuencia de cuadros baja provoca aliasing , produce artefactos de movimiento abruptos y degrada la calidad del vídeo. En consecuencia, la resolución temporal es un factor importante que afecta a la calidad del vídeo. Los algoritmos para FRC se utilizan ampliamente en aplicaciones que incluyen la mejora de la calidad visual, la compresión de vídeo y la generación de vídeo en cámara lenta.
La mayoría de los métodos FRC se pueden clasificar en métodos basados en flujo óptico o kernel [21] [22] y métodos basados en alucinación de píxeles. [23] [24]
Los métodos basados en flujo combinan linealmente los flujos ópticos predichos entre dos fotogramas de entrada para aproximar los flujos desde el fotograma intermedio de destino hasta los fotogramas de entrada. También proponen la inversión del flujo (proyección) para lograr una deformación de la imagen más precisa . Además, existen algoritmos que otorgan diferentes pesos a los vectores de flujo superpuestos según la profundidad del objeto de la escena a través de una capa de proyección de flujo.
Los métodos basados en alucinaciones de píxeles utilizan una convolución deformable para generar el cuadro central mediante la sustitución de flujos ópticos por vectores de desplazamiento. Existen algoritmos que también interpolan cuadros intermedios con la ayuda de una convolución deformable en el dominio de características. Sin embargo, dado que estos métodos alucinan directamente los píxeles a diferencia de los métodos FRC basados en flujos, los cuadros predichos tienden a ser borrosos cuando hay objetos que se mueven rápidamente.
{{cite book}}
: CS1 maint: varios nombres: lista de autores ( enlace )( Copia de Wayback Machine )