En audio digital , 44.100 Hz (representados alternativamente como 44,1 kHz ) es una frecuencia de muestreo común . El audio analógico se suele grabar muestreándolo 44.100 veces por segundo y, luego, estas muestras se utilizan para reconstruir la señal de audio al reproducirla.
ElLa frecuencia de muestreo de audio de 44,1 kHz se utiliza ampliamente debido al formato de disco compacto (CD), que se remonta a su uso por parte de Sony en 1979.
La frecuencia de muestreo de 44,1 kHz se originó a finales de los años 1970 con los adaptadores PCM , que grababan audio digital en casetes de vídeo , [nota 1] en particular el Sony PCM-1600 introducido en 1979 y trasladado a los modelos posteriores de esta serie. Esto se convirtió entonces en la base del Compact Disc Digital Audio (CD-DA), definido en el estándar Red Book en 1980. [1] : sec. 2.6 Su uso ha continuado como una opción en estándares de los años 1990 como el DVD , y en los años 2000, en estándares como HDMI . Esta frecuencia de muestreo se utiliza habitualmente para MP3 y otros formatos de archivos de audio de consumo que se crearon originalmente a partir de material extraído de discos compactos.
La selección de la frecuencia de muestreo se basó principalmente en la necesidad de reproducir el rango de frecuencia audible de 20 a 20 000 Hz (20 kHz). El teorema de muestreo de Nyquist-Shannon establece que se necesita una frecuencia de muestreo de más del doble de la frecuencia máxima de la señal que se va a grabar, lo que da como resultado una frecuencia requerida de más de 40 kHz. La frecuencia de muestreo exacta de 44,1 kHz se heredó de los adaptadores PCM, que era la forma más asequible de transferir datos desde el estudio de grabación al fabricante de CD en el momento en que se estaba desarrollando la especificación de CD. [1] : sec. 2.6
La tasa se eligió tras un debate entre fabricantes, en particular Sony y Philips , y su implementación por parte de Sony, lo que dio lugar a un estándar de facto . La elección real de la tasa fue objeto de cierto debate, con otras alternativas que incluían 44,1 / 1,001 ≈ 44,056 kHz (que corresponde a la tasa de campo de color NTSC de 60 / 1,001 = 59,94 Hz) o aproximadamente 44 kHz, propuesta por Philips. Finalmente, Sony prevaleció tanto en la frecuencia de muestreo (44,1 kHz) como en la profundidad de bits (16 bits por muestra, en lugar de 14 bits por muestra). El razonamiento técnico detrás de la tasa elegida está asociado con las características de la audición humana y los primeros sistemas de grabación de audio digital, como se describe a continuación. [1] : sec. 8.5
El teorema de muestreo de Nyquist-Shannon dice que la frecuencia de muestreo debe ser mayor que el doble de la frecuencia máxima que se desea reproducir. Para capturar el rango de audición humana de aproximadamente 20 Hz a 20.000 Hz, la frecuencia de muestreo tenía que ser mayor que 40 kHz.
Pero para evitar el aliasing al muestrear, las señales primero deben limitarse en banda a la mitad de la frecuencia de muestreo, lo que se puede lograr con un filtrado de paso bajo . Si bien un filtro de paso bajo ideal (un filtro sinc ) puede pasar perfectamente frecuencias por debajo de 20 kHz (sin atenuarlas) y cortar perfectamente frecuencias por encima de 20 kHz, este filtro ideal es teóricamente y prácticamente imposible de implementar ya que no es causal , por lo que en la práctica es necesaria una banda de transición , donde las frecuencias se atenúan parcialmente. Cuanto más ancha sea esta banda de transición, más fácil y económico es hacer un filtro anti-aliasing . La frecuencia de muestreo de 44,1 kHz permite una banda de transición de 2,05 kHz.
El audio digital temprano se grababa en cintas de video analógicas existentes, ya que las videograbadoras eran los únicos transportes disponibles con capacidad suficiente para almacenar longitudes significativas de audio digital. [nota 2] Para permitir la reutilización con una modificación mínima del equipo de video, estos funcionaban a la misma velocidad que el video y usaban gran parte de los mismos circuitos. 44,1 kHz se consideró la velocidad utilizable más alta compatible con video PAL y NTSC y que requería codificar no más de 3 muestras por línea de video por canal de audio.
La frecuencia de muestreo se compone de la siguiente manera: [nota 3]
NTSC tiene 490 líneas activas por cuadro, de un total de 525 líneas; PAL tiene 588 líneas activas por cuadro, de un total de 625 líneas.
44.100 es el producto de los cuadrados de los primeros cuatro números primos ( ) y, por lo tanto, tiene muchos factores enteros útiles .
Se utilizan varias reducciones a la mitad y duplicaciones de 44,1 kHz: las frecuencias más bajas, 11,025 kHz y 22,05 kHz , se encuentran en archivos WAV y son adecuadas para aplicaciones de bajo ancho de banda, mientras que las frecuencias más altas, 88,2 kHz y 176,4 kHz, se utilizan en masterización y en DVD-Audio ; las frecuencias más altas son útiles tanto por la razón habitual de proporcionar una resolución adicional (por lo tanto, menos sensible a las distorsiones introducidas por la edición) como para facilitar el filtrado de paso bajo, ya que es posible una banda de transición mucho más grande (entre lo audible para los humanos a 20 kHz y la mitad de la frecuencia de muestreo). Las frecuencias de 88,2 kHz y 176,4 kHz se utilizan principalmente cuando el destino final es un CD.
En los primeros tiempos del audio digital también se utilizaron otras frecuencias de muestreo. Una frecuencia de muestreo de 50 kHz, utilizada por Soundstream en la década de 1970, siguiendo un prototipo de 37 kHz. A principios de la década de 1980, se utilizó una frecuencia de muestreo de 32 kHz en las transmisiones (especialmente en el Reino Unido y Japón), porque es suficiente para las transmisiones estéreo de FM , que tienen un ancho de banda de 15 kHz. Se proporcionó algo de audio digital para uso doméstico en dos formatos EIAJ incompatibles , correspondientes a 525/59,94 (muestreo de 44.056 Hz) y 625/50 (muestreo de 44,1 kHz).
El formato de cinta de audio digital (DAT) se lanzó en 1987 con un muestreo de 48 kHz. Esta frecuencia de muestreo se ha convertido en la frecuencia estándar para el audio profesional . [2] Hasta hace poco, la conversión de frecuencia de muestreo entre 44 100 Hz y 48 000 Hz se complicaba por la alta relación numérica entre las frecuencias de estos, ya que el mínimo común denominador de 44 100 y 48 000 es 147:160, pero con la tecnología moderna esta conversión se logra de manera rápida y eficiente. [3] Las primeras máquinas DAT para el consumidor no admitían 44,1 kHz y esta diferencia dificultaba la realización de copias digitales directas de CD de 44,1 kHz utilizando equipos DAT de 48 kHz. [4]
Debido a la popularidad de los CD, existe una gran cantidad de equipos de 44,1 kHz, así como una gran cantidad de audio grabado en 44,1 kHz (o múltiplos de esta frecuencia). Sin embargo, algunos estándares más recientes utilizan 48 kHz además de 44,1 kHz o en lugar de este. [2] En video, 48 kHz es ahora el estándar, pero para el audio destinado a CD, todavía se utilizan 44,1 kHz (y múltiplos).
El estándar de TV HDMI (2003) permite tanto 44,1 kHz como 48 kHz (y múltiplos de estos). Esto proporciona compatibilidad con reproductores de DVD que reproducen contenido en CD, VCD y SVCD . Los estándares de DVD-Video y Blu-ray Disc utilizan solo múltiplos de 48 kHz.
La mayoría de las tarjetas de sonido para PC contienen un convertidor de señal digital a analógica capaz de funcionar de forma nativa a 44,1 kHz o 48 kHz. Algunos procesadores más antiguos incluyen solo una salida de 44,1 kHz, y algunos procesadores más nuevos y más económicos solo incluyen una salida de 48 kHz, lo que requiere que la PC realice una conversión de frecuencia de muestreo digital para generar otras frecuencias de muestreo. De manera similar, las tarjetas tienen limitaciones en las frecuencias de muestreo que admiten para la grabación.