stringtranslate.com

Desessing

La de-essing (también desibilización [1] ) es cualquier técnica destinada a reducir o eliminar la prominencia excesiva de consonantes sibilantes , como los sonidos normalmente representados en inglés por " s ", "z", "ch", "j" y "sh", en grabaciones de la voz humana. [2] La sibilancia se encuentra en frecuencias entre 2 y 10  kHz , dependiendo de la voz individual.

Causas

El exceso de sibilancia puede deberse a la compresión , a la elección y técnica del micrófono e incluso simplemente a la forma de la anatomía de la boca de una persona . Las frecuencias de sonido más bajas pueden resultar irritantes para el oído, especialmente con auriculares o cascos, e interferir en una transmisión de audio que, de otro modo, sería modulada y agradable.

Proceso de desesificación

Curva de ecualización que reduce los decibeles de un rango de frecuencias menos para una voz humana

El de-essing es un proceso de edición de audio dinámico que solo funciona cuando el nivel de la señal en el rango sibilante (el sonido ess) excede un umbral establecido. El de-essing reduce temporalmente el nivel de contenido de alta frecuencia en la señal cuando hay un sonido ess sibilante. [2] El de-essing se diferencia de la ecualización , que es un cambio estático en el nivel entre muchas frecuencias. Sin embargo, la ecualización de las frecuencias ess por sí sola se puede manipular para reducir el nivel de sibilancia.

Existen varios algoritmos basados ​​en el tiempo y la frecuencia que pueden reducir la sibilancia o eliminar la eses del sonido. Los enfoques en el dominio del tiempo, como los filtros de paso de banda, son más adecuados para aplicaciones en tiempo real, como la radio en vivo, debido a que tienen menos restricciones en el procesador de señal digital . Las aplicaciones de reproducción o fuera de línea incorporan métodos basados ​​en la transformada rápida de Fourier (FFT).

Uso de un complemento de eliminación de esessing dedicado

En el bastión digital actual de la producción de audio, la herramienta más utilizada para reducir la sibilancia es un complemento de de-esser. Se puede utilizar un ecualizador dinámico para lograr los mismos efectos que un de-esser, sin embargo, los fabricantes de complementos han adaptado estas herramientas para que funcionen de manera eficiente en las frecuencias medias y altas.

Un complemento de desessing comprimirá la señal deseada según la amplitud de la frecuencia seleccionada a medida que pasa por encima de un umbral preestablecido. En el caso de sibilancia excesiva, el problema suele estar entre 4 y 10 kHz. Algunos complementos darán forma a la envolvente de la compresión para lograr un efecto más musical.

La eliminación excesiva de sonoridades puede dar lugar a una manipulación excesiva de las transitorias, lo que resulta en el suavizado o endurecimiento de ciertas consonantes, produciendo efectos indeseables.

Compresión de cadena lateral o desessing de banda ancha

Eliminación de distorsión de banda ancha mediante cadena lateral filtrada con paso de banda

Con esta técnica, la señal que alimenta la cadena lateral de un compresor de rango dinámico se ecualiza o filtra de modo que las frecuencias sibilantes sean más prominentes. Como resultado, el compresor solo reduce el nivel de la señal cuando hay un alto nivel de sibilancia. Esto reduce el nivel en todo el rango de frecuencia. Debido a esto, los tiempos de ataque y liberación [ aclaración necesaria ] son ​​extremadamente importantes, y los ajustes de umbral no se pueden colocar tan bajos como con otros tipos de técnicas de eliminación de esess sin experimentar artefactos de sonido más evidentes .

Compresión de banda dividida

De-essing de banda dividida

Aquí, la señal se divide en dos rangos de frecuencia: un rango que contiene las frecuencias sibilantes y un rango que no las contiene. La señal que contiene las frecuencias sibilantes se envía a un compresor. El otro rango de frecuencia no se procesa. Finalmente, los dos rangos de frecuencia se combinan nuevamente en una sola señal.

La señal original se puede dividir en frecuencias altas (sibilantes) y bajas, o dividir de modo que las frecuencias por encima y por debajo de la sibilancia no se vean afectadas. Esta técnica es similar a la compresión multibanda.

Ecualización dinámica

De-essing de ecualización dinámica

La ganancia de un ecualizador paramétrico se reduce a medida que aumenta el nivel de sibilancia. El rango de frecuencia del ecualizador se centra en las frecuencias sibilantes.

Desessing con automatización

Un método más reciente de eliminación de sibilancias implica la automatización del nivel vocal en una estación de trabajo de audio digital (DAW). Siempre que se produzcan problemas de sibilancia, el nivel se puede configurar para que siga curvas de automatización dibujadas manualmente por el usuario.

Este método es posible gracias a la edición directa de los puntos de automatización, en lugar de programar mediante la manipulación de los controles deslizantes de ganancia en un modo de escritura. Un ingeniero de audio no podría reaccionar con la suficiente rapidez para reducir y restaurar con precisión los niveles vocales durante la breve duración de los sibilantes durante la reproducción en tiempo real.

De-essing sin automatización o con ecualización manual

La ess en la palabra hablada se resalta "instantáneamente" en la pantalla de forma de onda de una estación de trabajo de audio digital

Los programas de edición de audio, ya sean profesionales o amateurs como Audacity , pueden utilizar los efectos de ecualización integrados para reducir o eliminar los sonidos sibilantes que interfieren en una grabación. Aquí se describe un método común con Audacity. El proceso consta de dos fases:

  1. Analice la frecuencia del sonido de la voz mediante el muestreo de varias instancias y el cálculo del rango de frecuencias de la voz. El rango de sibilancia de las voces masculinas es de 3 a 6 kHz, mientras que el rango típico de las voces femeninas es de 6 a 8 kHz. [3]
  2. Aplicar un filtro de ecualización para silenciar la banda de frecuencia determinada entre −4 dB y −11 dB durante eventos de tiempo de frecuencia ess.

El tiempo de subida y bajada del filtro debe ser rápido (menos de 10 ms) para recortar únicamente las instancias específicas de sibilancia. [4]

Véase también

Referencias

  1. ^ De-esser: La guía para grabaciones vocales sin sibilancias , consultado el 4 de junio de 2022
  2. ^ ab Jeffs, Holden y Bohn (septiembre de 2005). "Capítulo 4. Compresores especializados". Procesadores dinámicos: tecnología y aplicaciones . Consultado el 20 de octubre de 2020 .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  3. ^ De-Esser (PDF) , Waves Audio , consultado el 23 de julio de 2021.
  4. ^ Reiss, Joshua D. (2014). Efectos de audio: teoría, implementación y aplicación . CRC Press. pp. 300–301. ISBN 978-1-4665-6028-4.

Enlaces externos