La reducción de ruido es el proceso de eliminar el ruido de una señal . Existen técnicas de reducción de ruido para audio e imágenes. Los algoritmos de reducción de ruido pueden distorsionar la señal hasta cierto punto. El rechazo de ruido es la capacidad de un circuito para aislar un componente de señal no deseado del componente de señal deseado, como ocurre con la relación de rechazo de modo común .
Todos los dispositivos de procesamiento de señales , tanto analógicos como digitales , tienen características que los hacen susceptibles al ruido. El ruido puede ser aleatorio con una distribución de frecuencia uniforme ( ruido blanco ) o ruido dependiente de la frecuencia introducido por el mecanismo de un dispositivo o algoritmos de procesamiento de señales .
En los sistemas electrónicos , un tipo importante de ruido es el silbido creado por el movimiento aleatorio de los electrones debido a la agitación térmica. Estos electrones agitados se suman y restan rápidamente de la señal de salida y así crean un ruido detectable .
En el caso de la película fotográfica y la cinta magnética , el ruido (tanto visible como audible) se introduce debido a la estructura granular del medio. En la película fotográfica, el tamaño de los granos de la película determina la sensibilidad de la película; las películas más sensibles tienen granos de mayor tamaño. En la cinta magnética, cuanto más grandes son los granos de las partículas magnéticas (generalmente óxido férrico o magnetita ), más propenso es el medio al ruido. Para compensar esto, se pueden utilizar áreas más grandes de película o cinta magnética para reducir el ruido a un nivel aceptable.
Los algoritmos de reducción de ruido tienden a alterar las señales en mayor o menor grado. El algoritmo de ortogonalización local de señal y ruido se puede utilizar para evitar cambios en las señales. [1]
Impulsar las señales en los datos sísmicos es especialmente crucial para las imágenes sísmicas , [2] [3] inversión, [4] [5] e interpretación, [6] mejorando así en gran medida la tasa de éxito en la exploración de petróleo y gas. [7] [8] [9] [10] La señal útil que está manchada en el ruido aleatorio ambiental a menudo se descuida y, por lo tanto, puede causar una discontinuidad falsa de eventos sísmicos y artefactos en la imagen migrada final. Mejorar la señal útil y al mismo tiempo preservar las propiedades de los bordes de los perfiles sísmicos atenuando el ruido aleatorio puede ayudar a reducir las dificultades de interpretación y los riesgos engañosos para la detección de petróleo y gas.
El silbido de la cinta es un problema que limita el rendimiento en la grabación de cintas analógicas . Esto está relacionado con el tamaño de las partículas y la textura utilizadas en la emulsión magnética que se rocía sobre los medios de grabación, y también con la velocidad relativa de la cinta a través de los cabezales de la misma .
Existen cuatro tipos de reducción de ruido: pregrabación de un solo extremo, reducción de silbidos de un solo extremo, reducción de ruido de superficie de un solo extremo y códec o sistemas de dos extremos. Los sistemas de pregrabación de un solo extremo (como Dolby HX Pro ) funcionan para afectar el medio de grabación en el momento de la grabación. Los sistemas de reducción de silbido de un solo extremo (como DNL [11] o DNR) funcionan para reducir el ruido a medida que se produce, incluso antes y después del proceso de grabación, así como para aplicaciones de transmisión en vivo. La reducción de ruido de superficie de un solo extremo (como CEDAR y los anteriores SAE 5000A, Burwen TNE 7000 y Packburn 101/323/323A/323AA y 325 [12] ) se aplica a la reproducción de discos fonográficos para abordar rayones, estallidos y no linealidades superficiales. Los expansores de rango dinámico de un solo extremo, como el sistema de recuperación de rango dinámico y reducción de ruido del autocorrelador lineal de fase (modelos 1000 y 4000), pueden reducir diversos ruidos de grabaciones antiguas. Los sistemas de doble extremo (como el sistema de reducción de ruido Dolby o dbx ) tienen un proceso de preénfasis aplicado durante la grabación y luego un proceso de desénfasis aplicado durante la reproducción.
Las grabaciones de sonido digitales modernas ya no necesitan preocuparse por el silbido de la cinta, por lo que no son necesarios los sistemas de reducción de ruido de estilo analógico. Sin embargo, un giro interesante es que los sistemas de tramado en realidad añaden ruido a una señal para mejorar su calidad.
Los sistemas de reducción de ruido con compresor de doble extremo tienen un proceso de preénfasis aplicado durante la grabación y luego un proceso de desénfasis aplicado durante la reproducción. Los sistemas incluyen los sistemas profesionales Dolby A [11] y Dolby SR de Dolby Laboratories , dbx Professional y dbx Type I de dbx , EMT NoiseBX de Donald Aldous , [13] Burwen Noise Eliminator , [14] [15] [16 ] Telcom c4 [11] de Telefunken y MXR de MXR Innovations [17] , así como los sistemas de consumo Dolby NR , Dolby B , [11] Dolby C y Dolby S , dbx Type II , [11] Telefunken's High Com [11] y High-Com II de Nakamichi , direcciones de Toshiba (Aurex AD-4) , [11] [18] ANRS de JVC [11] [18] y Super ANRS , [11] [18] Fisher / Sanyo 's Super D , [19] [11] [18] SNRS , [18] y el sistema Ex-Ko de Hungría/Alemania Oriental . [20] [18]
En algunos sistemas compander, la compresión se aplica durante la producción de medios profesionales y el oyente solo aplica la expansión; por ejemplo, sistemas como dbx disc , High-Com II , CX 20 [18] y UC utilizados para grabaciones de vinilo y Dolby FM , High Com FM y FMX utilizados en transmisiones de radio FM.
La primera técnica de reducción de ruido de audio ampliamente utilizada fue desarrollada por Ray Dolby en 1966. Diseñado para uso profesional, Dolby Type A era un sistema de codificación/decodificación en el que la amplitud de las frecuencias en cuatro bandas aumentaba durante la grabación (codificación) y luego disminuía proporcionalmente. durante la reproducción (decodificación). En particular, al grabar partes silenciosas de una señal de audio, se potenciarían las frecuencias superiores a 1 kHz. Esto tuvo el efecto de aumentar la relación señal-ruido en la cinta hasta 10 dB dependiendo del volumen de la señal inicial. Cuando se reprodujo, el decodificador invirtió el proceso, reduciendo de hecho el nivel de ruido hasta en 10 dB.
El sistema Dolby B (desarrollado en conjunto con Henry Kloss ) era un sistema de banda única diseñado para productos de consumo. El sistema Dolby B, aunque no era tan eficaz como Dolby A, tenía la ventaja de seguir siendo escuchable en sistemas de reproducción sin decodificador.
El circuito integrado Telefunken High Com U401BR también podría utilizarse para funcionar como un compansor mayoritariamente compatible con Dolby B. [21] En varias platinas High Com de última generación, la funcionalidad Dolby-B que emulaba D NR Expander funcionaba no solo para la reproducción, sino, como característica no documentada, también durante la grabación.
dbx era un sistema de reducción de ruido analógico de la competencia desarrollado por David E. Blackmer , fundador de Dbx, Inc. [22] Utilizaba un algoritmo de codificación/decodificación de raíz cuadrada media (RMS) con las frecuencias altas propensas al ruido aumentadas y el toda la señal alimentada a través de un compander 2:1. dbx operaba en todo el ancho de banda audible y, a diferencia de Dolby B, no se podía utilizar sin un decodificador. Sin embargo, podría lograr hasta 30 dB de reducción de ruido.
Dado que las grabaciones de vídeo analógico utilizan modulación de frecuencia para la parte de luminancia (señal de vídeo compuesto en sistemas de color directo), que mantiene la cinta en el nivel de saturación, la reducción de ruido estilo audio es innecesaria.
El limitador de ruido dinámico ( DNL ) es un sistema de reducción de ruido de audio introducido originalmente por Philips en 1971 para su uso en pletinas de casetes . [11] Su circuito también se basa en un solo chip . [23] [24]
National Semiconductor lo desarrolló aún más hasta convertirlo en reducción dinámica de ruido ( DNR ) para reducir los niveles de ruido en la telefonía de larga distancia . [25] Vendido por primera vez en 1981, DNR se confunde frecuentemente con el sistema de reducción de ruido Dolby, mucho más común . [26]
A diferencia de los sistemas de reducción de ruido Dolby y dbx Tipo I y Tipo II , DNL y DNR son sistemas de procesamiento de señal de solo reproducción que no requieren que se codifique primero el material fuente. Se pueden utilizar para eliminar el ruido de fondo de cualquier señal de audio, incluidas grabaciones en cinta magnética y transmisiones de radio FM , reduciendo el ruido hasta en 10 dB. [27] También se pueden usar junto con otros sistemas de reducción de ruido, siempre que se usen antes de aplicar DNR para evitar que DNR cause que el otro sistema de reducción de ruido se desvíe. [28]
Una de las primeras aplicaciones generalizadas de DNR fue en los sistemas estéreo de automóviles GM Delco en automóviles GM de EE. UU. introducidos en 1984. [29] También se usó en equipos de sonido de fábrica en vehículos Jeep en la década de 1980, como el Cherokee XJ . Hoy en día, los sistemas DNR, DNL y similares se utilizan con mayor frecuencia como sistemas de reducción de ruido en sistemas de micrófonos. [30]
Una segunda clase de algoritmos funciona en el dominio de tiempo-frecuencia utilizando algunos filtros lineales o no lineales que tienen características locales y a menudo se denominan filtros de tiempo-frecuencia. [31] [ página necesaria ] Por lo tanto, el ruido también se puede eliminar mediante el uso de herramientas de edición espectral, que funcionan en este dominio de tiempo-frecuencia, permitiendo modificaciones locales sin afectar la energía de la señal cercana. Esto se puede hacer manualmente, de forma muy parecida a como se hace en un programa de pintura. Otra forma es definir un umbral dinámico para filtrar el ruido, que se deriva de la señal local, nuevamente con respecto a una región de tiempo-frecuencia local. Todo lo que esté por debajo del umbral se filtrará, todo lo que esté por encima del umbral, como partes de una voz o ruido deseado , quedará intacto. La región normalmente se define por la ubicación de la frecuencia instantánea de la señal, [32] ya que la mayor parte de la energía de la señal a preservar se concentra alrededor de ella.
Otro enfoque más es el limitador de ruido automático y el supresor de ruido que se encuentran comúnmente en los transceptores de radioaficionados , transceptores de radio CB , etc. Ambos filtros antes mencionados se pueden usar por separado o en conjunto al mismo tiempo, dependiendo del transceptor en sí. .
La mayoría de las estaciones de trabajo de audio digital (DAW) y el software de edición de audio tienen una o más funciones de reducción de ruido.
Las imágenes tomadas con cámaras digitales o cámaras de película convencionales captarán ruido de diversas fuentes. El uso posterior de estas imágenes a menudo requerirá que se reduzca el ruido ya sea con fines estéticos o prácticos, como la visión por computadora .
En el ruido de sal y pimienta (perturbaciones escasas de luz y oscuridad), [33] también conocido como ruido impulsivo, [34] los píxeles de la imagen son muy diferentes en color o intensidad de los píxeles circundantes; la característica definitoria es que el valor de un píxel ruidoso no guarda relación con el color de los píxeles circundantes. Cuando se ve, la imagen contiene puntos blancos y oscuros, de ahí el término ruido de sal y pimienta. Generalmente, este tipo de ruido sólo afectará a una pequeña cantidad de píxeles de la imagen. Las fuentes típicas incluyen motas de polvo dentro de la cámara y elementos CCD sobrecalentados o defectuosos .
En el ruido gaussiano , [35] cada píxel de la imagen cambiará de su valor original en una cantidad (normalmente) pequeña. Un histograma, un gráfico de la cantidad de distorsión de un valor de píxel frente a la frecuencia con la que ocurre, muestra una distribución normal de ruido. Si bien son posibles otras distribuciones, la distribución gaussiana (normal) suele ser un buen modelo, debido al teorema del límite central que dice que la suma de diferentes ruidos tiende a aproximarse a una distribución gaussiana.
En cualquier caso, el ruido en diferentes píxeles puede estar correlacionado o no; En muchos casos, los valores de ruido en diferentes píxeles se modelan como independientes y distribuidos de manera idéntica y, por lo tanto, no correlacionados.
Existen muchos algoritmos de reducción de ruido en el procesamiento de imágenes. [36] Al seleccionar un algoritmo de reducción de ruido, se deben sopesar varios factores:
En fotografías del mundo real, el detalle de frecuencia espacial más alto consiste principalmente en variaciones de brillo ( detalle de luminancia ) en lugar de variaciones de tono ( detalle de croma ). La mayoría de los algoritmos de reducción de ruido fotográfico dividen el detalle de la imagen en componentes de croma y luminancia y aplican más reducción de ruido a los primeros o permiten al usuario controlar la reducción de ruido de croma y luminancia por separado.
Un método para eliminar el ruido es convolucionar la imagen original con una máscara que represente un filtro de paso bajo o una operación de suavizado. Por ejemplo, la máscara gaussiana comprende elementos determinados por una función gaussiana . Esta convolución acerca el valor de cada píxel a una mayor armonía con los valores de sus vecinos. En general, un filtro de suavizado establece cada píxel en el valor promedio, o un promedio ponderado, de sí mismo y de sus vecinos cercanos; el filtro gaussiano es sólo un posible conjunto de pesos.
Los filtros de suavizado tienden a desenfocar una imagen porque los valores de intensidad de píxeles que son significativamente más altos o más bajos que el vecindario circundante se difuminan en el área. Debido a esta confusión, los filtros lineales rara vez se utilizan en la práctica para reducir el ruido; [ cita necesaria ] Sin embargo, a menudo se utilizan como base para filtros de reducción de ruido no lineales.
Otro método para eliminar el ruido es hacer evolucionar la imagen bajo una ecuación diferencial parcial de suavizado similar a la ecuación del calor , que se llama difusión anisotrópica . Con un coeficiente de difusión espacialmente constante, esto es equivalente a la ecuación de calor o filtrado gaussiano lineal , pero con un coeficiente de difusión diseñado para detectar bordes, el ruido se puede eliminar sin desenfocar los bordes de la imagen.
Otro método para eliminar el ruido se basa en un promedio no local de todos los píxeles de una imagen. En particular, la cantidad de ponderación de un píxel se basa en el grado de similitud entre un pequeño parche centrado en ese píxel y el pequeño parche centrado en el píxel al que se le está eliminando el ruido.
Un filtro mediano es un ejemplo de filtro no lineal y, si se diseña correctamente, es muy bueno para preservar los detalles de la imagen. Para ejecutar un filtro de mediana:
Un filtro de mediana es un filtro de selección de rango (RS), un miembro particularmente severo de la familia de filtros de selección de rango condicionada (RCRS); [37] A veces se prefiere un miembro mucho más suave de esa familia, por ejemplo uno que selecciona el más cercano de los valores vecinos cuando el valor de un píxel es externo en su vecindad y, en caso contrario, lo deja sin cambios, especialmente en aplicaciones fotográficas.
Los filtros de mediana y otros filtros RCRS son buenos para eliminar el ruido de sal y pimienta de una imagen y también causan relativamente poca borrosidad en los bordes y, por lo tanto, se usan a menudo en aplicaciones de visión por computadora.
El objetivo principal de un algoritmo de eliminación de ruido de imagen es lograr tanto la reducción de ruido [38] como la preservación de características [39] utilizando bancos de filtros wavelet. [40] En este contexto, los métodos basados en wavelets son de particular interés. En el dominio wavelet, el ruido se distribuye uniformemente a lo largo de los coeficientes, mientras que la mayor parte de la información de la imagen se concentra en unos pocos grandes. [41] Por lo tanto, los primeros métodos de eliminación de ruido basados en wavelets se basaron en la umbralización de coeficientes de subbanda de detalle. [42] [ página necesaria ] Sin embargo, la mayoría de los métodos de umbralización de wavelets tienen el inconveniente de que el umbral elegido puede no coincidir con la distribución específica de los componentes de señal y ruido en diferentes escalas y orientaciones.
Para abordar estas desventajas, se han desarrollado estimadores no lineales basados en la teoría bayesiana. En el marco bayesiano, se ha reconocido que un algoritmo de eliminación de ruido exitoso puede lograr tanto la reducción del ruido como la preservación de las características si emplea una descripción estadística precisa de los componentes de la señal y el ruido. [41]
También existen métodos estadísticos para eliminar el ruido de las imágenes. Para el ruido gaussiano , se pueden modelar los píxeles en una imagen en escala de grises como con distribución normal automática, donde el verdadero valor en escala de grises de cada píxel se distribuye normalmente con una media igual al valor promedio en escala de grises de sus píxeles vecinos y una varianza determinada.
Denotemos los píxeles adyacentes al píxel. Entonces la distribución condicional de la intensidad de la escala de grises (en una escala) en el nodo ésimo es:
para un parámetro y varianza elegidos . Un método de eliminación de ruido que utiliza el modelo normal automático utiliza los datos de la imagen como un a priori bayesiano y la densidad normal automática como una función de probabilidad, y la distribución posterior resultante ofrece una media o moda como una imagen sin ruido. [43] [44]
Se puede aplicar un algoritmo de coincidencia de bloques para agrupar fragmentos de imágenes similares de macrobloques superpuestos de tamaño idéntico. Luego se filtran pilas de macrobloques similares en el dominio de transformación y finalmente cada fragmento de imagen se restaura a su ubicación original utilizando un promedio ponderado de los píxeles superpuestos. [45]
Los campos de contracción son una técnica de aprendizaje automático basada en campos aleatorios que ofrece un rendimiento comparable al de la coincidencia de bloques y el filtrado 3D, pero requiere una sobrecarga computacional mucho menor, de modo que se puede realizar directamente dentro de sistemas integrados . [46]
Se han propuesto varios enfoques de aprendizaje profundo para resolver la reducción de ruido [47] y tareas de restauración de imágenes . Deep Image Prior es una de esas técnicas que utiliza una red neuronal convolucional y se distingue porque no requiere datos de entrenamiento previo. [48]
La mayoría de los programas de edición de imágenes y fotografías de uso general tendrán una o más funciones de reducción de ruido (mediana, desenfoque, eliminación de manchas, etc.).
ExKo Breitband-Kompander Aufnahme/Wiedergabe 9 dB Tonband(NB. Falta la página 736 en el PDF vinculado).
[…] Super-Dolby im Plus N 55 […] Der Kompander "Plus N55" arbeitet nach dem von Sanyo entwickelten Super-D-Noise-Reduction-System. Er ist speziell für 3-Kopf-Geräte konzipiert und den Pegelverhältnissen von japanischen Cassetten-Bandgeräten angepaßt. Para los dispositivos Hi-Fi que tienen un conector DIN externo, puede utilizar el dispositivo de audio con el Plus N55 al mismo tiempo que el compresor (codificador) conectado a 60 mV para el control de volumen y el compresor por sí solo, sin conexión de señal. Las ebenfalls im gesamten Tonfrequenzbereich wirksamen Kompressor-Funktionen sind in dos Frequenz-Bereiche aufgeteilt (f
0
≈ 4,8 kHz), um joyils ein optimas Arbeiten in diesen Bereichen zu gewährleisten […] Die Kompander-Kennlinien des Super-D-Verfahrens […] veranschaulichen den Vorgang der wechselweisen Kompression und Expansion. Estas líneas de codificador y decodificador se utilizan entre los dos ajustes de rango de 0 dB y −20 dB con controles de color rosa […] Para que las líneas de codificador/decodificador sean tan precisas, también debe utilizar los decodificadores sin O dB. Der Absenkungsgrad für das Bandrauschen beträgt hier rd. 10 dB […] Wird ein Pegel von −20 dB eingespeist, hebt der Encoder diesen auf einen Ausgangspegel von −10 dB an […] Am Decoder Eingang liegt nun - vom Bandgerät kommend ein Signalpegel von −10 dB, der nun gemeinsam mit dem La banda de frecuencia aumenta hasta 10 dB en la configuración heredada […] Al usar la señal del codificador en un nivel de -60 dB, se aumenta a -30 dB y también se expande hasta 30 dB. Así que wird das Bandrauschen immer um den jeweiligen Kompressions/Expansionsgrad unterdrückt. […] "Über Alles" gesehen stellen sich bei jedem Eingangspegel lineare Frequenzgänge im gesamten Tonfrequenzbereich ein […] Das setzt allerdings voraus, daß die Kompressor- und Expander-Kennlinien bei Aufnahme und Wiedergabe deckungsgleich angesteuert werden. Man erreicht this mit einer Eichung über den eingebauten Pegeltongenerator, wobei man den Ausschlag der Fluoreszenz-Anzeige am Plus N55 und am Aussteuerungsanzeiger des Tonbandgerätes auf gleiche Werte (zum Beispiel −5 dB) einpegeln muß. Das ist ein ein maliger Vorgang bei gleichbleibender Gerätekombination. Danach wird die Aufnahme nur noch am Kompander ausgesteuert. […] Beachtenswert sind noch die Verzerrungen, die durch das Einfügen einer ganzen Anzahl von Transistorstufen in den Übertragungsweg zusätzlich entstehen. El diagrama […] muestra los factores de frecuencia ajustados en la configuración del codificador y decodificador en el Plus N55. Im Vergleich zu linearen Verstärkern sind sie relativ hoch, gegenüber den im Bereich der Vollaussteuerung vorliegenden kubischen Klirrfaktoren bei Cassetten-Bändern aber noch vertretbar. […]
AI Image Denoiser es mucho más agresivo, mejora significativamente los detalles, pero también aplica un gran suavizado. DxO PureRAW, que mejora directamente la imagen sin procesar mediante el aprendizaje profundo entrenado en "millones de imágenes analizadas por DxO durante 15 años", fue fácilmente el más efectivo de los muchos eliminadores de ruido probados.