stringtranslate.com

Comparación de grabación analógica y digital.

El sonido se puede grabar , almacenar y reproducir utilizando técnicas digitales o analógicas . Ambas técnicas introducen errores y distorsiones en el sonido y estos métodos pueden compararse sistemáticamente. Músicos y oyentes han discutido sobre la superioridad de las grabaciones de sonido digitales frente a las analógicas. Los argumentos a favor de los sistemas analógicos incluyen la ausencia de mecanismos de error fundamentales que están presentes en los sistemas de audio digital, incluido el aliasing y la implementación de filtros antialiasing asociados , la fluctuación y el ruido de cuantificación . [1] Los defensores de lo digital señalan los altos niveles de rendimiento posibles con el audio digital, incluida una excelente linealidad en la banda audible y bajos niveles de ruido y distorsión. [2] : 7 

Dos diferencias destacadas en el rendimiento entre los dos métodos son el ancho de banda y la relación señal-ruido (relación S/N). El ancho de banda del sistema digital viene determinado, según la frecuencia de Nyquist , por la frecuencia de muestreo utilizada. El ancho de banda de un sistema analógico depende de las capacidades físicas y electrónicas de los circuitos analógicos. La relación S/N de un sistema digital puede estar limitada por la profundidad de bits del proceso de digitalización, pero la implementación electrónica de circuitos de conversión introduce ruido adicional. En un sistema analógico existen otras fuentes naturales de ruido analógico, como ruido de parpadeo e imperfecciones en el medio de grabación. Otras diferencias de rendimiento son específicas de los sistemas comparados, como la capacidad de algoritmos de filtrado más transparentes en los sistemas digitales [3] y la saturación armónica y las variaciones de velocidad de los sistemas analógicos.

Gama dinámica

El rango dinámico de un sistema de audio es una medida de la diferencia entre los valores de amplitud más pequeños y más grandes que se pueden representar en un medio. Lo digital y lo analógico difieren tanto en los métodos de transferencia como en el almacenamiento, así como en el comportamiento que exhiben los sistemas debido a estos métodos.

El rango dinámico de los sistemas de audio digitales puede superar al de los sistemas de audio analógicos. Las cintas de casete analógicas de consumo tienen un rango dinámico de 60 a 70 dB. Las emisiones analógicas de FM rara vez tienen un rango dinámico superior a 50 dB. [4] El rango dinámico de un disco de vinilo de corte directo puede superar los 70 dB. Las cintas maestras de estudio analógicas pueden tener un rango dinámico de hasta 77 dB. [5] Un LP hecho de diamante perfecto tiene un tamaño atómico de aproximadamente 0,5 nanómetros , que, con un tamaño de ranura de 8 micrones , produce un rango dinámico teórico de 110 dB. Un LP hecho de vinilo perfecto tendría un rango dinámico teórico de 70 dB. [6] Las mediciones indican el rendimiento real máximo en el rango de 60 a 70 dB. [7] Normalmente, un convertidor analógico a digital de 16 bits puede tener un rango dinámico de entre 90 y 95 dB, [8] : 132  mientras que la relación señal-ruido (aproximadamente el equivalente al rango dinámico, teniendo en cuenta la ausencia de ruido de cuantificación pero presencia de silbido de cinta) de una grabadora de cinta profesional de carrete a carrete de ¼ de pulgada estaría entre 60 y 70 dB a la salida nominal de la grabadora. [8] : 111 

Los beneficios de utilizar grabadoras digitales con una precisión superior a 16 bits se pueden aplicar a los 16 bits de un CD de audio. El fundador de Meridian Audio , John Robert Stuart, destaca que con el dither correcto , la resolución de un sistema digital es teóricamente infinita y que es posible, por ejemplo, resolver sonidos a −110 dB (por debajo de la escala completa digital) en una escala bien definida. canal diseñado de 16 bits. [9] : 3 

Condiciones de sobrecarga

Existen algunas diferencias en el comportamiento de los sistemas analógicos y digitales cuando hay señales de alto nivel presentes, donde existe la posibilidad de que dichas señales puedan sobrecargar el sistema. Con señales de alto nivel, la cinta magnética analógica se acerca a la saturación y la respuesta de alta frecuencia cae en proporción a la respuesta de baja frecuencia. Si bien no es deseable, el efecto audible de esto puede ser razonablemente inobjetable. [10] Por el contrario, los grabadores PCM digitales muestran un comportamiento no benigno en caso de sobrecarga; [11] : 65  muestras que exceden el nivel máximo de cuantificación simplemente se truncan, recortando la forma de onda directamente, lo que introduce distorsión en forma de grandes cantidades de armónicos de frecuencia más alta. En principio, los sistemas digitales PCM tienen el nivel más bajo de distorsión no lineal con la amplitud de señal completa. Suele ocurrir lo contrario en los sistemas analógicos, donde la distorsión tiende a aumentar a niveles altos de señal. Un estudio de Manson (1980) consideró los requisitos de un sistema de audio digital para una transmisión de alta calidad. Concluyó que un sistema de 16 bits sería suficiente, pero destacó la pequeña reserva que proporcionaba el sistema en condiciones de funcionamiento normales. Por esta razón, se sugirió utilizar un limitador de señal de acción rápida o un ' cortador suave ' para evitar que el sistema se sobrecargue. [12]

En muchas grabaciones, las distorsiones de alto nivel en los picos de la señal pueden quedar enmascaradas audiblemente por la señal original, por lo que pueden ser aceptables grandes cantidades de distorsión en los niveles máximos de la señal. La diferencia entre sistemas analógicos y digitales es la forma de error de señal de alto nivel. Algunos de los primeros convertidores analógicos a digitales mostraban un comportamiento no benigno cuando estaban sobrecargados, donde las señales de sobrecarga se "envolvían" de escala completa positiva a negativa. Los diseños de convertidores modernos basados ​​en modulación sigma-delta pueden volverse inestables en condiciones de sobrecarga. Por lo general, un objetivo de diseño de los sistemas digitales es limitar las señales de alto nivel para evitar sobrecargas. [11] : 65  Para evitar sobrecargas, un sistema digital moderno puede comprimir las señales de entrada de modo que no se pueda alcanzar la escala completa digital [13] : 4 

Degradación física

A diferencia de la duplicación analógica, las copias digitales son réplicas exactas que pueden duplicarse indefinidamente y sin pérdida de generación , en principio. La corrección de errores permite que los formatos digitales toleren un deterioro significativo de los medios, aunque los medios digitales no son inmunes a la pérdida de datos. Los discos compactos CD-R de consumo tienen una vida útil limitada y variable debido a problemas inherentes y de calidad de fabricación. [14]

Con los discos de vinilo, habrá cierta pérdida de fidelidad en cada reproducción del disco. Esto se debe al desgaste de la aguja en contacto con la superficie del disco. Las cintas magnéticas, tanto analógicas como digitales, se desgastan por la fricción entre la cinta y los cabezales, guías y otras partes del transporte de la cinta a medida que la cinta se desliza sobre ellos. El residuo marrón depositado en los hisopos durante la limpieza del recorrido de la cinta de una máquina de cinta es en realidad partículas de recubrimiento magnético que se desprenden de las cintas. El síndrome del cobertizo pegajoso es un problema frecuente con las cintas más antiguas. Las cintas también pueden sufrir arrugas, estiramientos y pliegues en los bordes de la base de la cinta de plástico, particularmente debido a casetes de cinta de baja calidad o desalineados.

Cuando se reproduce un CD, no hay contacto físico, ya que los datos se leen ópticamente mediante un rayo láser. Por lo tanto, no se produce tal deterioro del soporte y el CD, con el cuidado adecuado, sonará exactamente igual cada vez que se reproduzca (sin tener en cuenta el envejecimiento del reproductor y del propio CD); sin embargo, este es un beneficio del sistema óptico, no de la grabación digital, y el formato Laserdisc disfruta del mismo beneficio sin contacto con las señales ópticas analógicas. Los CD se pudren y se degradan lentamente con el tiempo, incluso si se almacenan correctamente y no se reproducen. [15] M-DISC , una tecnología óptica grabable que se comercializa como legible durante 1.000 años, está disponible en ciertos mercados, pero hasta finales de 2020 nunca se ha vendido en formato CD-R . (Sin embargo, el sonido se puede almacenar en un M-DISC DVD-R utilizando el formato DVD-Audio ).

Ruido

Para las señales de audio electrónicas, las fuentes de ruido incluyen ruido mecánico, eléctrico y térmico en el ciclo de grabación y reproducción. Se puede cuantificar la cantidad de ruido que un equipo de audio añade a la señal original. Matemáticamente, esto se puede expresar mediante la relación señal-ruido (SNR o relación S/N). A veces, en su lugar se cita el rango dinámico máximo posible del sistema.

Con los sistemas digitales, la calidad de reproducción depende de los pasos de conversión de analógico a digital y de digital a analógico, y no depende de la calidad del medio de grabación, siempre que sea adecuado para retener los valores digitales sin errores. Los medios digitales capaces de almacenamiento y recuperación con bits perfectos han sido comunes durante algún tiempo, ya que generalmente fueron desarrollados para el almacenamiento de software que no tolera errores.

Según la teoría, el proceso de conversión de analógico a digital siempre introducirá distorsión de cuantificación. Esta distorsión se puede representar como ruido de cuantificación no correlacionado mediante el uso de interpolación . La magnitud de este ruido o distorsión está determinada por el número de niveles de cuantificación. En los sistemas binarios, esto está determinado y normalmente expresado en términos del número de bits . Cada bit adicional añade aproximadamente 6 dB a la SNR posible (por ejemplo, 24 x 6 = 144 dB para cuantificación de 24 bits y 120 dB para cuantificación de 20 bits). El sistema digital de 16 bits del CD de audio Red Book tiene 2 16 = 65,536 amplitudes de señal posibles, lo que teóricamente permite una SNR de 98  dB . [2] : 49 

Retumbar

El ruido sordo es una forma de ruido característico causado por imperfecciones en los cojinetes de los tocadiscos. El plato tiende a tener una ligera cantidad de movimiento además de la rotación deseada y la superficie del tocadiscos también se mueve ligeramente hacia arriba, hacia abajo y de lado a lado. Este movimiento adicional se añade a la señal deseada en forma de ruido, normalmente de frecuencias muy bajas, creando un sonido retumbante durante los pasajes tranquilos. Los tocadiscos muy económicos a veces utilizan rodamientos de bolas , que es muy probable que generen cantidades audibles de ruido sordo. Los tocadiscos más caros tienden a utilizar cojinetes de manguito masivos , que es mucho menos probable que generen cantidades ofensivas de ruido. El aumento de la masa del plato giratorio también tiende a reducir el ruido. Un buen tocadiscos debería tener un ruido de al menos 60 dB por debajo del nivel de salida especificado del captador. [16] : 79–82  Debido a que no tienen partes móviles en la ruta de la señal, los sistemas digitales no están sujetos a ruidos.

Guau y aleteo

Wow y flutter son un cambio en la frecuencia de un dispositivo analógico y son el resultado de imperfecciones mecánicas. Wow es una forma de aleteo que ocurre a un ritmo más lento. Wow y flutter se notan más en señales que contienen tonos puros. Para los discos LP, la calidad del tocadiscos tendrá un gran efecto en el nivel de wow y flutter. Un buen tocadiscos tendrá valores de wow y flutter inferiores al 0,05%, que es la variación de velocidad con respecto al valor medio. [16] Wow y flutter también pueden estar presentes en la grabación, como resultado del funcionamiento imperfecto de la grabadora. Debido al uso de osciladores de cristal de precisión para su base de tiempo , los sistemas digitales no están sujetos a sacudidas ni aleteos.

Respuesta frecuente

Para los sistemas digitales, el límite superior de la respuesta de frecuencia está determinado por la frecuencia de muestreo . La elección de la frecuencia de muestreo de la muestra en un sistema digital se basa en el teorema de muestreo de Nyquist-Shannon . Esto establece que una señal muestreada se puede reproducir exactamente siempre que se muestree a una frecuencia mayor que el doble del ancho de banda de la señal, la frecuencia de Nyquist . Por lo tanto, una frecuencia de muestreo de 40 kHz es matemáticamente suficiente para capturar toda la información contenida en una señal que tiene componentes de frecuencia menores o iguales a 20 kHz. El teorema de muestreo también requiere que el contenido de frecuencia por encima de la frecuencia de Nyquist se elimine de la señal antes de muestrearla. Esto se logra utilizando filtros anti-aliasing que requieren una banda de transición para reducir suficientemente el aliasing. El ancho de banda proporcionado por la frecuencia de muestreo de 44.100 Hz utilizada por el estándar para los CD de audio es lo suficientemente amplio como para cubrir todo el rango de audición humana , que se extiende aproximadamente de 20 Hz a 20 kHz. [2] : 108  Las grabadoras digitales profesionales pueden grabar frecuencias más altas, mientras que algunos sistemas de consumo y de telecomunicaciones registran un rango de frecuencia más restringido.

Algunos fabricantes de cintas analógicas especifican respuestas de frecuencia de hasta 20 kHz, pero es posible que estas mediciones se hayan realizado a niveles de señal más bajos. [16] Los casetes compactos pueden tener una respuesta que se extiende hasta 15 kHz a un nivel de grabación completo (0 dB). [17] En niveles más bajos (−10 dB), los casetes suelen estar limitados a 20 kHz debido al autoborrado de la cinta.

La respuesta de frecuencia de un reproductor de LP convencional podría ser de 20 Hz a 20 kHz, ±3 dB. La respuesta de baja frecuencia de los discos de vinilo está restringida por el ruido sordo (descrito anteriormente), así como por las características físicas y eléctricas de todo el brazo fonocaptor y el conjunto del transductor. La respuesta de alta frecuencia del vinilo depende del cartucho. Los discos CD4 contenían frecuencias de hasta 50 kHz. Se han cortado experimentalmente frecuencias de hasta 122 kHz en discos LP. [18]

alias

Los sistemas digitales requieren que todo el contenido de la señal de alta frecuencia por encima de la frecuencia de Nyquist se elimine antes del muestreo, lo que, si no se hace, dará como resultado que estas frecuencias ultrasónicas se "plieguen" en frecuencias en el rango audible, produciendo un tipo de distorsión llamada alias . El aliasing se evita en los sistemas digitales mediante un filtro antialiasing . Sin embargo, no es práctico diseñar un filtro analógico que elimine con precisión todo el contenido de frecuencia exactamente por encima o por debajo de una determinada frecuencia de corte. [19] En su lugar, normalmente se elige una frecuencia de muestreo que esté por encima del requisito de Nyquist. Esta solución se llama sobremuestreo y permite utilizar un filtro antialiasing menos agresivo y de menor coste.

Los primeros sistemas digitales pueden haber sufrido una serie de degradaciones de la señal relacionadas con el uso de filtros analógicos anti-aliasing, por ejemplo, dispersión del tiempo, distorsión no lineal , ondulación , dependencia de la temperatura de los filtros, etc. [20] : 8  Uso de un diseño de sobremuestreo y delta -Modulación sigma , un filtro anti-aliasing analógico menos agresivo se puede complementar con un filtro digital. [19] Este enfoque tiene varias ventajas ya que se puede hacer que el filtro digital tenga una función de transferencia de dominio de frecuencia casi ideal, con baja ondulación dentro de banda y sin envejecimiento ni deriva térmica. [20] : 18  Sin embargo, el filtro antialiasing digital puede introducir degradaciones debido a la respuesta en el dominio del tiempo, particularmente a frecuencias de muestreo más bajas. [21] [22]

Los sistemas analógicos no están sujetos a un límite de Nyquist ni a aliasing y, por lo tanto, no requieren filtros antialiasing ni ninguna de las consideraciones de diseño asociadas con ellos. En cambio, los límites de los formatos de almacenamiento analógico están determinados por las propiedades físicas de su construcción.

Tasas de muestreo

El audio con calidad de CD se muestrea a 44.100 Hz ( frecuencia Nyquist = 22,05 kHz) y a 16 bits. Muestrear la forma de onda a frecuencias más altas y permitir una mayor cantidad de bits por muestra permite reducir aún más el ruido y la distorsión. DAT puede muestrear audio hasta 48 kHz, mientras que DVD-Audio puede ser de 96 o 192 kHz y una resolución de hasta 24 bits. Con cualquiera de estas frecuencias de muestreo, la información de la señal se captura por encima de lo que generalmente se considera el rango de frecuencia de la audición humana . Las frecuencias de muestreo más altas imponen menos restricciones en la implementación del filtro anti-aliasing, lo que puede resultar en una menor complejidad y menos distorsión de la señal.

Trabajo realizado en 1981 por Muraoka et al. [23] demostraron que las señales musicales con componentes de frecuencia superiores a 20 kHz solo se distinguían de aquellas sin ellas por unos pocos de los 176 sujetos de prueba. [24] Un estudio de percepción realizado por Nishiguchi et al. (2004) concluyeron que "no se encontraron diferencias significativas entre sonidos con y sin componentes de muy alta frecuencia entre los estímulos sonoros y los sujetos... sin embargo, [Nishiguchi et al] aún no pueden confirmar ni negar la posibilidad de que algunos sujetos puedan discriminar entre sonidos musicales con y sin componentes de muy alta frecuencia." [25]

En pruebas de escucha a ciegas realizadas por Bob Katz en 1996, relatadas en su libro Mastering Audio: The Art and the Science , los sujetos que utilizaban el mismo equipo de reproducción de alta frecuencia de muestreo no podían discernir ninguna diferencia audible entre el material del programa filtrado de forma idéntica para eliminar las frecuencias superiores. 20 kHz frente a 40 kHz. Esto demuestra que la presencia o ausencia de contenido ultrasónico no explica la variación auditiva entre las frecuencias de muestreo. Plantea que la variación se debe en gran medida al rendimiento de los filtros limitadores de banda en los convertidores. Estos resultados sugieren que el principal beneficio de utilizar frecuencias de muestreo más altas es que empuja la consiguiente distorsión de fase de los filtros limitadores de banda fuera del rango audible y que, en condiciones ideales, es posible que no sean necesarias frecuencias de muestreo más altas. [26] Dunn (1998) examinó el rendimiento de los convertidores digitales para ver si estas diferencias en el rendimiento podrían explicarse por los filtros limitadores de banda utilizados en los convertidores y buscó los artefactos que introducen. [27]

Cuantización

Una ilustración de la cuantificación de una forma de onda de audio muestreada usando 4 bits

Una señal se registra digitalmente mediante un convertidor analógico a digital , que mide la amplitud de una señal analógica a intervalos regulares especificados por la frecuencia de muestreo y luego almacena estos números muestreados en el hardware de la computadora. Los números en las computadoras representan un conjunto finito de valores discretos, lo que significa que si una señal analógica se muestrea digitalmente usando métodos nativos (sin interpolación), la amplitud de la señal de audio simplemente se redondeará a la representación más cercana. Este proceso se llama cuantificación y estos pequeños errores en las mediciones se manifiestan auditivamente como ruido de bajo nivel o distorsión. Esta forma de distorsión, a veces llamada distorsión granular o de cuantificación, ha sido señalada como una falla de algunos sistemas y grabaciones digitales, particularmente algunas de las primeras grabaciones digitales, donde se decía que la versión digital era inferior a la versión analógica. [28] Sin embargo, "si la cuantificación se realiza utilizando el dither correcto, entonces la única consecuencia de la digitalización es efectivamente la adición de un ruido de fondo blanco, no correlacionado, benigno y aleatorio. El nivel del ruido depende del número de bits en el canal." [9] : 6 

El rango de valores posibles que una muestra puede representar numéricamente está determinado por el número de dígitos binarios utilizados. Esto se llama resolución y generalmente se conoce como profundidad de bits en el contexto del audio PCM. El nivel de ruido de cuantificación está directamente determinado por este número, disminuyendo exponencialmente (linealmente en unidades dB) a medida que aumenta la resolución. Con una profundidad de bits adecuada, el ruido aleatorio de otras fuentes dominará y enmascarará completamente el ruido de cuantificación. El estándar Redbook CD utiliza 16 bits, lo que mantiene el ruido de cuantificación 96 dB por debajo de la amplitud máxima, muy por debajo de un nivel discernible con casi cualquier material fuente. [29] La adición de interpolación efectiva significa que, "en términos prácticos, la resolución está limitada por nuestra capacidad de resolver sonidos en el ruido... No tenemos ningún problema para medir (y escuchar) señales de –110 dB en un sistema bien diseñado. Canal de 16 bits." [9] El DVD-Audio y los equipos de grabación profesionales más modernos permiten muestras de 24 bits.

Los sistemas analógicos no necesariamente tienen niveles digitales discretos en los que se codifica la señal. En consecuencia, la precisión con la que se puede conservar la señal original está limitada por el nivel de ruido intrínseco y el nivel máximo de señal de los medios y del equipo de reproducción.

Cuantización en medios analógicos.

Dado que los medios analógicos están compuestos de moléculas , la estructura microscópica más pequeña representa la unidad de cuantificación más pequeña de la señal registrada. Los procesos naturales de oscilación, como los movimientos térmicos aleatorios de las moléculas, el tamaño distinto de cero del instrumento de lectura y otros efectos de promedio, hacen que el límite práctico sea mayor que el de la característica estructural molecular más pequeña. Un LP teórico compuesto de diamante perfecto, con un tamaño de ranura de 8 micrones y un tamaño de característica de 0,5 nanómetros, tiene una cuantificación similar a una muestra digital de 16 bits. [6]

Tramado como solución

Una ilustración del tramado utilizado en el procesamiento de imágenes.
Una ilustración del tramado utilizado en el procesamiento de imágenes. Se ha insertado una desviación aleatoria antes de reducir la paleta a sólo 16 colores, lo que es análogo al efecto de tramado en una señal de audio.

Es posible hacer que el ruido de cuantización sea audiblemente benigno aplicando interpolación . Para hacer esto, se agrega ruido a la señal original antes de la cuantificación. El uso óptimo del dither tiene el efecto de hacer que el error de cuantificación sea independiente de la señal, [11] : 143  y permite que la información de la señal se retenga por debajo del bit menos significativo del sistema digital. [9] : 3 

Los algoritmos de tramado también suelen tener la opción de emplear algún tipo de modelado de ruido , que empuja la frecuencia de gran parte del ruido de tramado a áreas que son menos audibles para los oídos humanos, reduciendo el nivel del ruido de fondo aparente para el oyente.

El tramado se aplica comúnmente durante la masterización antes de la reducción final de la profundidad de bits [26] y también en varias etapas del DSP .

Jitter de tiempo

Un aspecto que puede degradar el rendimiento de un sistema digital es la fluctuación . Este es el fenómeno de las variaciones en el tiempo de lo que debería ser el espaciado correcto de muestras discretas según la frecuencia de muestreo. Esto puede deberse a imprecisiones del tiempo del reloj digital. Idealmente, un reloj digital debería producir un pulso de sincronización a intervalos exactamente regulares. Otras fuentes de fluctuación dentro de los circuitos electrónicos digitales son la fluctuación inducida por los datos, donde una parte del flujo digital afecta a una parte posterior a medida que fluye a través del sistema, y ​​la fluctuación inducida por la fuente de alimentación, donde el ruido de la fuente de alimentación causa irregularidades en el tiempo de señales en los circuitos que alimenta.

La precisión de un sistema digital depende de los valores de amplitud muestreados, pero también depende de la regularidad temporal de estos valores. Las versiones analógicas de esta dependencia temporal se conocen como error de tono y wow-and-flutter.

La fluctuación periódica produce ruido de modulación y puede considerarse como el equivalente al flutter analógico. [30] La fluctuación aleatoria altera el ruido de fondo del sistema digital. La sensibilidad del convertidor a la fluctuación depende del diseño del convertidor. [11] Se ha demostrado que una fluctuación aleatoria de 5  ns puede ser significativa para sistemas digitales de 16 bits. [30]

En 1998, Benjamin y Gannon investigaron la audibilidad del jitter mediante pruebas de escucha. [11] : 34  Descubrieron que el nivel más bajo de fluctuación audible era de alrededor de 10 ns ( rms ). Esto fue en una señal de prueba de onda sinusoidal de 17 kHz . Con la música, ningún oyente encontró fluctuaciones audibles en niveles inferiores a 20 ns. Un artículo de Ashihara et al. (2005) intentaron determinar los umbrales de detección de fluctuaciones aleatorias en señales musicales. Su método implicó pruebas de escucha ABX . Al discutir sus resultados, los autores comentaron que:

Hasta ahora, la fluctuación real en los productos de consumo parece ser demasiado pequeña para ser detectada, al menos en la reproducción de señales musicales. Sin embargo, no está claro si los umbrales de detección obtenidos en el presente estudio realmente representarían el límite de la resolución auditiva o estarían limitados por la resolución del equipo. Las distorsiones debidas a una fluctuación muy pequeña pueden ser menores que las distorsiones debidas a las características no lineales de los altavoces. Ashihara y Kiryu [8] evaluaron la linealidad del altavoz y los auriculares. Según sus observaciones, los auriculares parecen ser más preferibles que los altavoces para producir suficiente presión sonora en los tímpanos con menores distorsiones. [31]

Procesamiento de la señal

Después de la grabación inicial, es común que la señal de audio se altere de alguna manera, como por ejemplo con el uso de compresión , ecualización , retardos y reverberación . Con lo analógico, esto viene en forma de componentes de hardware externos , y con lo digital, lo mismo generalmente se logra con complementos en una estación de trabajo de audio digital (DAW).

Una comparación del filtrado analógico y digital muestra las ventajas técnicas de ambos métodos. Los filtros digitales son más precisos y flexibles. Los filtros analógicos son más simples, pueden ser más eficientes y no introducen latencia.

Hardware analógico

Una ilustración del cambio de fase.
Cambio de fase: la onda sinusoidal en rojo se ha retrasado en un tiempo igual al ángulo , que se muestra como la onda sinusoidal en azul.

When altering a signal with a filter, the output signal may differ in time from the signal at the input, which is measured as its phase response. All analog equalizers exhibit this behavior, with the amount of phase shift differing in some pattern, and centered around the band that is being adjusted. Although this effect alters the signal in a way other than a strict change in frequency response, it is usually not objectionable to listeners.[32]

Digital filters

Because the variables involved can be precisely specified in the calculations, digital filters can be made to objectively perform better than analog components.[3][33] Other processing such as delay and mixing can be done exactly.

Digital filters are also more versatile. For example, the linear phase equalizer does not introduce frequency-dependent phase shift. This filter may be implemented digitally using a finite impulse response filter but has no practical implementation using analog components.

A practical advantage of digital processing is the more convenient recall of settings. Plug-in parameters can be stored on the computer, whereas parameter details on an analog unit must be written down or otherwise recorded if the unit needs to be reused. This can be cumbersome when entire mixes must be recalled manually using an analog console and outboard gear. When working digitally, all parameters can simply be stored in a DAW project file and recalled instantly. Most modern professional DAWs also process plug-ins in real time, which means that processing can be largely non-destructive until final mix-down.

Analog modeling

Many plug-ins exist now that incorporate analog modeling. There are audio engineers that endorse them and feel that they compare equally in sound to the analog processes that they imitate. Analog modeling carries some benefits over their analog counterparts, such as the ability to remove noise from the algorithms and modifications to make the parameters more flexible. On the other hand, other engineers also feel that the modeling is still inferior to the genuine outboard components and still prefer to mix "outside the box".[34]

Sound quality

Subjective evaluation

La evaluación subjetiva intenta medir qué tan bien funciona un componente de audio según el oído humano. La forma más común de prueba subjetiva es una prueba de escucha, en la que el componente de audio simplemente se utiliza en el contexto para el que fue diseñado. Esta prueba es popular entre los revisores de alta fidelidad, donde el revisor utiliza el componente durante un período de tiempo y luego describe el rendimiento en términos subjetivos. Las descripciones comunes incluyen si el componente tiene un sonido brillante o cálido , o qué tan bien logra presentar una imagen espacial .

Otro tipo de prueba subjetiva se realiza en condiciones más controladas e intenta eliminar posibles sesgos de las pruebas de escucha. Este tipo de pruebas se realizan con el componente oculto al oyente y se denominan pruebas ciegas . Para evitar posibles sesgos por parte de la persona que realiza la prueba, la prueba ciega se puede realizar de modo que esta persona tampoco conozca el componente que se está probando. Este tipo de prueba se llama prueba doble ciego. Este tipo de prueba se utiliza a menudo para evaluar el rendimiento de la compresión de audio con pérdida .

Los críticos de las pruebas doble ciego consideran que no permiten que el oyente se sienta completamente relajado al evaluar el componente del sistema y, por lo tanto, no puede juzgar las diferencias entre los diferentes componentes tan bien como en las pruebas videntes (no ciegas). Quienes emplean el método de prueba doble ciego pueden intentar reducir el estrés del oyente dándole una cierta cantidad de tiempo para entrenarlo. [35]

Primeras grabaciones digitales

Las primeras máquinas de audio digitales tenían resultados decepcionantes, ya que los convertidores digitales introducían errores que el oído podía detectar. [36] Las compañías discográficas lanzaron sus primeros LP basados ​​en masters de audio digital a finales de los años 1970. Los CD estuvieron disponibles a principios de la década de 1980. En ese momento la reproducción de sonido analógico era una tecnología madura .

Hubo una respuesta crítica mixta a las primeras grabaciones digitales publicadas en CD. En comparación con los discos de vinilo, se observó que el CD revelaba mucho más la acústica y el ruido de fondo del entorno de grabación. [37] Por esta razón, las técnicas de grabación desarrolladas para discos analógicos, por ejemplo, la colocación del micrófono, tuvieron que adaptarse para adaptarse al nuevo formato digital. [37]

Algunas grabaciones analógicas fueron remasterizadas para formatos digitales. Las grabaciones analógicas realizadas en acústica natural de salas de conciertos tendían a beneficiarse de la remasterización. [38] El proceso de remasterización fue criticado ocasionalmente por estar mal manejado. Cuando la grabación analógica original era bastante brillante, la remasterización a veces daba como resultado un énfasis antinatural en los agudos. [38]

Super Audio CD y DVD-Audio

El formato Super Audio CD (SACD) fue creado por Sony y Philips , quienes también fueron los desarrolladores del formato de CD de audio estándar anterior. SACD utiliza Direct Stream Digital (DSD) basado en modulación delta-sigma . Usando esta técnica, los datos de audio se almacenan como una secuencia de valores de amplitud fija (es decir, 1 bit) a una frecuencia de muestreo de 2,884 MHz, que es 64 veces la frecuencia de muestreo de 44,1 kHz utilizada por el CD. En cualquier momento, la amplitud de la señal analógica original está representada por la densidad de unos o ceros en el flujo de datos. Por lo tanto, este flujo de datos digitales se puede convertir a analógico pasándolo a través de un filtro de paso bajo analógico.

El formato DVD-Audio utiliza PCM lineal estándar con frecuencias de muestreo y profundidades de bits variables, que como mínimo igualan y suelen superar con creces las del audio CD estándar (16 bits, 44,1 kHz).

En la prensa popular de alta fidelidad se había sugerido que el PCM lineal "crea [una] reacción de estrés en las personas" y que el DSD "es el único sistema de grabación digital que no [...] tiene estos efectos". [39] Esta afirmación parece tener su origen en un artículo de 1980 del Dr. John Diamond . [40] El núcleo de la afirmación de que las grabaciones PCM (la única técnica de grabación digital disponible en ese momento) creaban una reacción de estrés se basaba en el uso de la técnica pseudocientífica de kinesiología aplicada , por ejemplo por el Dr. Diamond en una presentación de la 66ª Convención de la AES (1980). con el mismo título. [41] Diamond había utilizado previamente una técnica similar para demostrar que la música rock (a diferencia de la clásica) era mala para la salud debido a la presencia del "ritmo anapéstico detenido". [42] Las afirmaciones de Diamond sobre el audio digital fueron retomadas por Mark Levinson , quien afirmó que mientras las grabaciones PCM provocaban una reacción de estrés, las grabaciones DSD no. [43] [44] [45] Sin embargo, una prueba subjetiva doble ciego entre PCM lineal de alta resolución (DVD-Audio) y DSD no reveló una diferencia estadísticamente significativa. Los oyentes que participaron en esta prueba notaron su gran dificultad para escuchar cualquier diferencia entre los dos formatos. [46]

Preferencia analógica

El resurgimiento del vinilo se debe en parte a la imperfección del audio analógico, que añade "calidez". [47] Algunos oyentes prefieren este tipo de audio al de un CD. El fundador y editor Harry Pearson de la revista The Absolute Sound dice que "los LP son decididamente más musicales. Los CD drenan el alma de la música. La implicación emocional desaparece". El productor de doblaje Adrian Sherwood tiene sentimientos similares sobre la cinta de casete analógica, que prefiere por su sonido "más cálido". [48]

Quienes favorecen el formato digital destacan los resultados de pruebas a ciegas, que demuestran el alto rendimiento posible con los grabadores digitales. [49] La afirmación es que el "sonido analógico" es más un producto de imprecisiones del formato analógico que cualquier otra cosa. Uno de los primeros y mayores defensores del audio digital fue el director de orquesta clásico Herbert von Karajan , quien dijo que la grabación digital era "definitivamente superior a cualquier otra forma de grabación que conozcamos". También fue pionero en el fallido Digital Compact Cassette y dirigió la primera grabación que se lanzó comercialmente en CD: Eine Alpensinfonie de Richard Strauss . La percepción de que el audio analógico es demostrablemente superior también fue cuestionada por los analistas musicales luego de las revelaciones de que el sello audiófilo Mobile Fidelity Sound Lab había estado utilizando de manera encubierta archivos Direct Stream Digital para producir lanzamientos de vinilo comercializados como provenientes de cintas maestras analógicas, con el abogado y audiófilo Randy. Braun afirma que "estas personas que dicen tener oídos de oro y pueden oír la diferencia entre lo analógico y lo digital, bueno, resulta que no pueden". [50] [51]

Sistemas híbridos

Si bien las palabras audio analógico generalmente implican que el sonido se describe utilizando un enfoque de señal continua, y las palabras audio digital implican un enfoque discreto, existen métodos de codificación de audio que se encuentran en algún punto entre los dos. De hecho, todos los sistemas analógicos muestran un comportamiento discreto (cuantizado) a escala microscópica. [52] Si bien los discos de vinilo y los casetes compactos comunes son medios analógicos y utilizan métodos de codificación física cuasi lineales (por ejemplo, profundidad de surco en espiral, intensidad del campo magnético de la cinta ) sin cuantización o alias notables, existen sistemas analógicos no lineales que exhiben efectos similares a los que se encuentran en los digitales, como el aliasing y los pisos dinámicos "duros" (por ejemplo, audio de alta fidelidad con modulación de frecuencia en cintas de video, señales codificadas con PWM ).

Ver también

Referencias

  1. ^ Liversidge, Anthony (febrero de 1995). "Analógico versus digital: ¿la industria musical ha destronado injustamente el vinilo?". Omni . vol. 17, núm. 5. Archivado desde el original el 7 de marzo de 2015 . Consultado el 22 de marzo de 2017 .
  2. ^ abc Maes, enero; Vercammen, Marc, eds. (2001). Tecnología de audio digital: una guía para CD, MiniDisc, SACD, DVD (A), MP3 y DAT (4 ed.). Prensa focalizada. ISBN 0240516540. Por lo tanto, un sistema de 16 bits proporciona una relación teórica señal-ruido de 98 dB...
  3. ^ ab "Capítulo 21: Comparación de filtros". dspguide.com . Consultado el 13 de septiembre de 2012 .
  4. ^ Garrison, Mark (23 de septiembre de 2011). "Enciclopedia de grabación doméstica: rango dinámico".
  5. ^ "Transferencia de audio de última generación". El Archivo de Audio . Consultado el 14 de mayo de 2018 . NAB de señal a ruido (pista de 2,0 mm, dos pistas de 1/4 de pulgada, RMS, ponderación A) 30 ips - 75 dB
  6. ^ ab Lesurf, Jim (18 de mayo de 2000). "Los defectos 'digitales' del disco de larga duración". Universidad de St. Andrews . Consultado el 22 de septiembre de 2017 .
  7. ^ Fremer, Michael (6 de enero de 1999). "Pase el preamplificador de fono Aleph Ono". Estereófilo . Consultado el 14 de mayo de 2018 .
  8. ^ ab Metzler, Bob (2005). El manual de medición de audio (2 ed.). Precisión de audio, EE. UU . Consultado el 9 de marzo de 2008 .
  9. ^ abcd Stuart, J. "Codificación de audio digital de alta calidad" (PDF) . Meridian Audio Ltd. Archivado desde el original (PDF) el 11 de octubre de 2007 . Consultado el 9 de marzo de 2008 .Este artículo es sustancialmente el mismo que el artículo de Stuart de JAES de 2004 "Coding for High-Resolution Audio Systems", Journal of the Audio Engineering Society , volumen 52, número 3, págs. 117-144; Marzo de 2004.
  10. ^ Elsea, Peter (1996). "Grabación analógica de sonido". Estudios de Música Electrónica de la Universidad de California, Santa Cruz. Archivado desde el original el 16 de octubre de 2009 . Consultado el 9 de marzo de 2008 .
  11. ^ abcde Dunn, Julián (2003). "Técnicas de medición para audio digital: nota de aplicación n.º 5 de precisión de audio". Audio Precision, Inc. Archivado desde el original el 20 de marzo de 2007 . Consultado el 9 de marzo de 2008 .
  12. ^ Manson, W. (1980). «Sonido digital: resolución de codificación de señal de estudio para retransmisión» (PDF) . Departamento de Investigación de la BBC, División de Ingeniería. pag. 8.
  13. ^ Jones, Wayne; Wolfe, Michael; Tanner, Theodore C. Jr.; Dinu, Daniel (marzo de 2003). Desafíos de prueba en dispositivos de audio de computadoras personales. 114ª Convención AES. Archivado desde el original el 7 de marzo de 2008 . Consultado el 9 de marzo de 2008 .
  14. ^ "CD-R ilegible en menos de dos años". myce.com . 19 de agosto de 2003 . Consultado el 1 de febrero de 2007 .
  15. ^ Byers, Fred R (octubre de 2003). «Cuidado y Manipulación de CD y DVD» (PDF) . Consejo de Bibliotecas y Recursos de Información . Consultado el 27 de julio de 2014 .
  16. ^ abc Driscoll, R. (1980). Sonido Hi-Fi práctico , 'Analógico y digital', páginas 61–64; 'El recogedor, el brazo y el tocadiscos', páginas 79–82. Hamlin. ISBN 0-600-34627-7
  17. ^ Stark, C. (1989). "Conceptos y sistemas de alta fidelidad". Artículo de Macropedia 'Sonido'. vol. 27 (15 ed.). Enciclopedia Británica . pag. 625.
  18. ^ "dominar". Comentarios positivos.com . Consultado el 15 de agosto de 2012 .
  19. ^ ab Thompson, Dan. Comprender el audio . Berklee Press, 2005, cap. 14.
  20. ^ ab Hawksford, Malcolm (septiembre de 1991). Introducción a las imágenes de audio digital de audio (PDF) . Actas de la Décima Conferencia Internacional AES. Londres. Archivado desde el original (PDF) el 29 de septiembre de 2007 . Consultado el 9 de marzo de 2008 .
  21. ^ Historia, Mike (septiembre de 1997). "Una explicación sugerida para (algunas de) las diferencias audibles entre el material de audio con una frecuencia de muestreo alta y una frecuencia de muestreo convencional" (PDF) . dCS Ltd. Archivado (PDF) desde el original el 28 de noviembre de 2009.
  22. ^ Robjohns, Hugh (agosto de 2016). "Precisión en el dominio del tiempo MQA y calidad de audio digital". soundonsound.com . Sonido sobre sonido. Archivado desde el original el 10 de marzo de 2023.
  23. ^ Muraoka, Teruo; Iwahara, Makoto; Yamada, Yasuhiro (1981). "Examen de los requisitos de ancho de banda de audio para una transmisión óptima de la señal de sonido". Revista de la Sociedad de Ingeniería de Audio . 29 (1/2): 2–9.
  24. ^ Kaoru, A.; Shogo, K (2001). Umbral de detección para tonos superiores a 22 kHz. 110º Convenio AEC. Documento 5401 de la Sociedad de Ingeniería de Audio{{cite conference}}: Mantenimiento CS1: posdata ( enlace )
  25. ^ Nishiguchi, Toshiyuki; Iwaki, Masakazu; Ando, ​​Akio (2004). Discriminación perceptiva entre sonidos musicales con y sin componentes de muy alta frecuencia. Nota de Laboratorios NHK No. 486 (Informe). NHK . Archivado desde el original el 16 de octubre de 2015 . Consultado el 15 de agosto de 2012 .
  26. ^ ab Katz, Bob (2015). Masterización del audio: el arte y la ciencia (3ª ed.). Prensa focalizada. pag. 316-318. ISBN 978-0240818962.
  27. ^ Dunn, Julián (1998). "Filtrado antialias y antiimagen: los beneficios de los formatos de frecuencia de muestreo de 96 kHz para quienes no pueden oír por encima de 20 kHz" (PDF) . Nanophon Limited . Consultado el 27 de julio de 2014 .
  28. ^ Rodilla, Anthony B.; Hawksford, Malcolm J. (febrero de 1995). Evaluación de sistemas digitales y grabación digital utilizando datos de audio en tiempo real. 98ª Convención AES. pag. 3.
  29. ^ Hass, Jeffrey (2013). "Capítulo 5: Principios del audio digital". Centro de Música Electrónica e Informática . Universidad de Indiana.
  30. ^ ab Rumsey, F.; Watkinson, J (1995). "Secciones 2.5 y 6". El manual de interfaz digital (2 ed.). Prensa focalizada. págs. 37, 154-160.
  31. ^ Ashihara, Kaoru; Kiryu, Shogo; Koizumi, Nobuo; Nishimura, Akira; Ohga, Juro; Sawaguchi, Masaki; Yoshikawa, Shokichiro (2005). "Umbral de detección de distorsiones debidas a fluctuaciones en audio digital". Ciencia y tecnología acústica . 26 (1): 50–54. doi : 10.1250/ast.26.50 . Archivado desde el original el 12 de agosto de 2009 . Consultado el 31 de enero de 2014 .
  32. ^ Steve Green, Una nueva perspectiva sobre los filtros de interpolación y diezmado (PDF) , Cirrus Logic , consultado el 20 de febrero de 2022
  33. ^ John Eargle, Chris Foreman (2002). Ingeniería de audio para el refuerzo del sonido, las ventajas de la transmisión digital y el procesamiento de señales. ISBN 9780634043550. Consultado el 14 de septiembre de 2012 .
  34. ^ "Secretos de los ingenieros de mezcla: Chris Lord-Alge". Mayo de 2007 . Consultado el 13 de septiembre de 2012 .
  35. ^ Toole, Floyd (1994). "Sección 11.7: Procedimiento experimental". En Borwick, John (ed.). Manual de altavoces y auriculares (2 ed.). Prensa focalizada. págs. 481–488. ISBN 0-240-51371-1.
  36. ^ Watkinson, J. (1994). "Sección 1.2: ¿Qué es el audio digital? ¿Qué podemos oír?". Introducción al audio digital. Prensa focalizada. págs.3, 26. ISBN 0-240-51378-9.
  37. ^ ab Greenfield, E.; et al. (1986). Marzo, Iván (ed.). La guía Penguin de discos compactos, casetes y LP . Libros de pingüinos, Inglaterra.
  38. ^ ab Greenfield, E.; et al. (1990). "Prefacio". En marzo, Iván (ed.). La guía Penguin de discos compactos . Libros de pingüinos, Inglaterra. págs. viii-ix. ISBN 0-14-046887-0.
  39. ^ Hawksford, M. (2001). SDM versus LPCM: el debate continúa (PDF) . 110ª Convención AES. Archivado desde el original (PDF) el 13 de mayo de 2006, documento 5397.{{cite conference}}: Mantenimiento CS1: posdata ( enlace )
  40. ^ Diamante, John (2003) [1980]. "Estrés humano provocado por grabaciones digitalizadas". El Centro Diamante . Archivado desde el original el 12 de agosto de 2004 . Consultado el 17 de julio de 2013 .
  41. ^ Diamante, Juan; Lagadec, Roger (diciembre de 1985). "Más sobre el estrés humano provocado por grabaciones digitalizadas y la respuesta". Revista de la Sociedad de Ingeniería de Audio . AES . 33 (12): 968 . Consultado el 16 de agosto de 2013 .
  42. ^ Más completo, John Grant (1981). ¿Están bien los niños?: La generación del rock y su deseo de muerte oculto . págs. 130-135. ISBN 0812909704.
  43. ^ Levinson, marca. "Revitalizando la industria del audio: música y salud" (PDF) . Archivado desde el original (PDF) el 23 de marzo de 2014.
  44. ^ Levinson, marca. "Mark Levinson: CD frente a SACD y LP". Redrosemusic.com. Archivado desde el original el 29 de febrero de 2012 . Consultado el 16 de agosto de 2013 .
  45. ^ Phillips, Wes (5 de julio de 2005). "Mark Levinson y el gato montés". Estereofilia. Stereophile.com . Consultado el 16 de agosto de 2013 .
  46. ^ Blech, Dominik; Yang, Min-Chi (8 a 11 de mayo de 2004). DVD-Audio versus SACD: discriminación perceptiva de formatos de codificación de audio digital (PDF) . Convenio AES: 116. Berlín: Sociedad de Ingeniería de Audio . Archivado desde el original el 27 de septiembre de 2007 . Consultado el 27 de julio de 2014 .
  47. ^ Deffes, Olivia (30 de enero de 2020). "Repetición de actuación: amantes de la música preparándose para escuchar el vinilo, otra vez". El abogado . Consultado el 30 de enero de 2020 .
  48. ^ Paul, James (26 de septiembre de 2003). "Anoche una cinta mixta me salvó la vida | Música | The Guardian". Londres: Arts.guardian.co.uk . Consultado el 15 de agosto de 2012 .
  49. ^ "Artículo sobre pruebas ABX". Sociedad de Audio de Boston. 23 de febrero de 1984 . Consultado el 15 de agosto de 2012 .
  50. ^ Edgers, Geoff (5 de agosto de 2022). "Cómo el dueño de una tienda de discos de Phoenix prendió fuego al mundo de los audiófilos". El Washington Post . Washington, DC ISSN  0190-8286. OCLC  1330888409.
  51. ^ Sinclair, Paul (6 de agosto de 2022). "Sábado Deluxe / 6 de agosto de 2022". Edición SuperDeluxe . Archivado desde el original el 9 de agosto de 2022 . Consultado el 9 de agosto de 2022 .
  52. ^ Lesurf, Jim. "¿Analógico o digital?". La guía escocesa de electrónica . St-andrews.ac.uk . Consultado el 15 de agosto de 2012 .

Bibliografía

enlaces externos