La calidad del sonido es, por lo general, una evaluación de la precisión, fidelidad o inteligibilidad de la salida de audio de un dispositivo electrónico. La calidad se puede medir objetivamente, como cuando se utilizan herramientas para medir la precisión con la que el dispositivo reproduce un sonido original; o se puede medir subjetivamente, como cuando los oyentes humanos responden al sonido o miden su similitud percibida con otro sonido. [1]
La calidad del sonido de una reproducción o grabación depende de varios factores, entre ellos el equipo utilizado para realizarla, [2] el procesamiento y masterización realizados a la grabación, el equipo utilizado para reproducirla, así como el entorno de escucha utilizado para reproducirla. [3] En algunos casos, se puede aplicar un procesamiento como la ecualización , la compresión del rango dinámico o el procesamiento estéreo a una grabación para crear un audio que sea significativamente diferente del original, pero que pueda ser percibido como más agradable para un oyente. En otros casos, el objetivo puede ser reproducir el audio lo más fielmente posible al original.
Cuando se aplica a dispositivos electrónicos específicos, como altavoces , micrófonos , amplificadores o auriculares, la calidad del sonido suele referirse a la precisión, y los dispositivos de mayor calidad proporcionan una reproducción más precisa. Cuando se aplica a pasos de procesamiento como la masterización de grabaciones, la precisión absoluta puede ser secundaria a preocupaciones artísticas o estéticas. En otras situaciones, como la grabación de una actuación musical en directo, la calidad del audio puede referirse a la colocación adecuada de los micrófonos en una sala para aprovechar al máximo la acústica de la misma .
El audio digital se almacena en muchos formatos. La forma más simple es PCM sin comprimir , donde el audio se almacena como una serie de muestras de audio cuantificadas espaciadas a intervalos regulares en el tiempo. [4] A medida que las muestras se colocan más cerca unas de otras en el tiempo, se pueden reproducir frecuencias más altas. Según el teorema de muestreo , cualquier señal con ancho de banda limitado (que no contenga un componente sinusoidal puro), ancho de banda B, se puede describir perfectamente con más de 2B muestras por segundo, lo que permite una reconstrucción perfecta de la señal analógica con ancho de banda limitado. [5] Por ejemplo, para un ancho de banda de audición humana entre 0 y 20 kHz, el audio debe muestrearse por encima de los 40 kHz. Debido a la necesidad de filtrar las frecuencias ultrasónicas resultantes de la conversión a una señal analógica, en la práctica se utilizan frecuencias de muestreo ligeramente más altas: 44,1 kHz ( audio CD ) o 48 kHz ( DVD ).
En PCM, cada muestra de audio describe la presión sonora en un instante en el tiempo con una precisión limitada. La precisión limitada da como resultado un error de cuantificación , una forma de ruido que se agrega a la grabación. Para reducir el error de cuantificación, se puede utilizar más precisión en cada medición a expensas de muestras más grandes (consulte profundidad de bits de audio ). Con cada bit adicional agregado a una muestra, el error de cuantificación se reduce aproximadamente en 6 dB . Por ejemplo, el audio de CD usa 16 bits por muestra y, por lo tanto, tendrá un ruido de cuantificación aproximadamente 96 dB por debajo del nivel máximo posible de presión sonora (cuando se suma sobre el ancho de banda completo).
La cantidad de espacio necesario para almacenar PCM depende de la cantidad de bits por muestra, la cantidad de muestras por segundo y la cantidad de canales. Para audio de CD, esto es 44.100 muestras por segundo, 16 bits por muestra y 2 canales para audio estéreo, lo que da como resultado 1.411.200 bits por segundo. Sin embargo, este espacio se puede reducir en gran medida utilizando la compresión de audio . En la compresión de audio, las muestras de audio se procesan utilizando un códec de audio . En un códec sin pérdida , las muestras de audio se procesan sin descartar información al empaquetar muestras repetitivas o redundantes en una forma de almacenamiento más eficiente. Luego, un decodificador sin pérdida reproduce el PCM original sin cambios en la calidad. La compresión de audio sin pérdida generalmente logra una reducción del 30 al 50% en el tamaño del archivo. Los códecs de audio sin pérdida comunes incluyen FLAC , ALAC , Monkey's Audio y otros.
Si se requiere una compresión adicional, se puede utilizar una compresión de audio con pérdida, como MP3 , Ogg Vorbis o AAC . En estas técnicas, las técnicas de compresión sin pérdida se mejoran procesando el audio para reducir la precisión de los detalles que es poco probable o imposible que el oído humano perciba utilizando principios de la psicoacústica . Después de eliminar estos detalles, se puede aplicar una compresión con pérdida al resto para reducir en gran medida el tamaño del archivo. Por lo tanto, la compresión de audio con pérdida permite una reducción del 75-95% en el tamaño del archivo, pero corre el riesgo de reducir potencialmente la calidad del audio si se descarta información importante por error.