La de-essing (también desibilización [1] ) es cualquier técnica destinada a reducir o eliminar la prominencia excesiva de consonantes sibilantes , como los sonidos normalmente representados en inglés por " s ", "z", "ch", "j" y "sh", en grabaciones de la voz humana. [2] La sibilancia se encuentra en frecuencias entre 2 y 10 kHz , dependiendo de la voz individual.
El exceso de sibilancia puede deberse a la compresión , a la elección y técnica del micrófono e incluso simplemente a la forma de la anatomía de la boca de una persona . Las frecuencias de sonido más bajas pueden resultar irritantes para el oído, especialmente con auriculares o cascos, e interferir en una transmisión de audio que, de otro modo, sería modulada y agradable.
El de-essing es un proceso de edición de audio dinámico que solo funciona cuando el nivel de la señal en el rango sibilante (el sonido ess) excede un umbral establecido. El de-essing reduce temporalmente el nivel de contenido de alta frecuencia en la señal cuando hay un sonido ess sibilante. [2] El de-essing se diferencia de la ecualización , que es un cambio estático en el nivel entre muchas frecuencias. Sin embargo, la ecualización de las frecuencias ess por sí sola se puede manipular para reducir el nivel de sibilancia.
Existen varios algoritmos basados en el tiempo y la frecuencia que pueden reducir la sibilancia o eliminar la eses del sonido. Los enfoques en el dominio del tiempo, como los filtros de paso de banda, son más adecuados para aplicaciones en tiempo real, como la radio en vivo, debido a que tienen menos restricciones en el procesador de señal digital . Las aplicaciones de reproducción o fuera de línea incorporan métodos basados en la transformada rápida de Fourier (FFT).
En el bastión digital actual de la producción de audio, la herramienta más utilizada para reducir la sibilancia es un complemento de de-esser. Se puede utilizar un ecualizador dinámico para lograr los mismos efectos que un de-esser, sin embargo, los fabricantes de complementos han adaptado estas herramientas para que funcionen de manera eficiente en las frecuencias medias y altas.
Un complemento de desessing comprimirá la señal deseada según la amplitud de la frecuencia seleccionada a medida que pasa por encima de un umbral preestablecido. En el caso de sibilancia excesiva, el problema suele estar entre 4 y 10 kHz. Algunos complementos darán forma a la envolvente de la compresión para lograr un efecto más musical.
La eliminación excesiva de sonoridades puede dar lugar a una manipulación excesiva de las transitorias, lo que resulta en el suavizado o endurecimiento de ciertas consonantes, produciendo efectos indeseables.
Con esta técnica, la señal que alimenta la cadena lateral de un compresor de rango dinámico se ecualiza o filtra de modo que las frecuencias sibilantes sean más prominentes. Como resultado, el compresor solo reduce el nivel de la señal cuando hay un alto nivel de sibilancia. Esto reduce el nivel en todo el rango de frecuencia. Debido a esto, los tiempos de ataque y liberación [ aclaración necesaria ] son extremadamente importantes, y los ajustes de umbral no se pueden colocar tan bajos como con otros tipos de técnicas de eliminación de esess sin experimentar artefactos de sonido más evidentes .
Aquí, la señal se divide en dos rangos de frecuencia: un rango que contiene las frecuencias sibilantes y un rango que no las contiene. La señal que contiene las frecuencias sibilantes se envía a un compresor. El otro rango de frecuencia no se procesa. Finalmente, los dos rangos de frecuencia se combinan nuevamente en una sola señal.
La señal original se puede dividir en frecuencias altas (sibilantes) y bajas, o dividir de modo que las frecuencias por encima y por debajo de la sibilancia no se vean afectadas. Esta técnica es similar a la compresión multibanda.
La ganancia de un ecualizador paramétrico se reduce a medida que aumenta el nivel de sibilancia. El rango de frecuencia del ecualizador se centra en las frecuencias sibilantes.
Un método más reciente de eliminación de sibilancias implica la automatización del nivel vocal en una estación de trabajo de audio digital (DAW). Siempre que se produzcan problemas de sibilancia, el nivel se puede configurar para que siga curvas de automatización dibujadas manualmente por el usuario.
Este método es posible gracias a la edición directa de los puntos de automatización, en lugar de programar mediante la manipulación de los controles deslizantes de ganancia en modo de escritura. Un ingeniero de audio no podría reaccionar con la suficiente rapidez para reducir y restaurar con precisión los niveles vocales durante la breve duración de los sibilantes durante la reproducción en tiempo real.
El software de edición de audio, ya sea profesional o amateur como Audacity , puede utilizar los efectos de ecualización integrados para reducir o eliminar los sonidos sibilantes que interfieren en una grabación. Aquí se describe un método común con Audacity. El proceso consta de dos fases:
El tiempo de subida y bajada del filtro debe ser rápido (menos de 10 ms) para recortar únicamente las instancias específicas de sibilancia. [4]
{{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace )