La supresión y cancelación de eco son métodos utilizados en telefonía para mejorar la calidad de la voz al evitar que se genere eco o eliminarlo una vez que ya está presente. Además de mejorar la calidad subjetiva del audio, la supresión de eco aumenta la capacidad lograda mediante la supresión del silencio al evitar que el eco viaje a través de una red de telecomunicaciones . Los supresores de eco se desarrollaron en la década de 1950 en respuesta al primer uso de satélites para telecomunicaciones.
Los métodos de supresión y cancelación de eco se denominan comúnmente supresión de eco acústico ( AES ) y cancelación de eco acústico ( AEC ), y más raramente cancelación de eco de línea ( LEC ). En algunos casos, estos términos son más precisos, ya que existen varios tipos y causas de eco con características únicas, incluido el eco acústico (sonidos de un altavoz que se reflejan y registran mediante un micrófono, que pueden variar sustancialmente con el tiempo) y el eco de línea (impulsos eléctricos causados, por ejemplo, por el acoplamiento entre los cables de envío y recepción, desajustes de impedancia, reflexiones eléctricas, etc., [1] que varía mucho menos que el eco acústico). En la práctica, sin embargo, se utilizan las mismas técnicas para tratar todos los tipos de eco, por lo que un cancelador de eco acústico puede cancelar el eco de línea así como el eco acústico. AEC en particular se utiliza comúnmente para referirse a los canceladores de eco en general, independientemente de si fueron diseñados para eco acústico, eco de línea o ambos.
Aunque los supresores de eco y los canceladores de eco tienen objetivos similares (evitar que una persona que habla escuche el eco de su propia voz), los métodos que utilizan son diferentes:
Las normas ITU G.168 y P.340 describen los requisitos y pruebas para canceladores de eco en aplicaciones digitales y PSTN , respectivamente.
En telefonía , el eco es la copia reflejada de la voz de una persona que se escucha algún tiempo después. Si el retraso es bastante significativo (más de unos pocos cientos de milisegundos), se considera molesto. Si el retraso es muy pequeño (decenas de milisegundos o menos [3] ), el fenómeno se llama efecto local . Si el retraso es ligeramente más largo, alrededor de 50 milisegundos, los humanos no pueden escuchar el eco como un sonido distinto, sino que escuchan un efecto de coro . [3]
En los primeros tiempos de las telecomunicaciones, se utilizaba la supresión de eco para reducir la naturaleza desagradable de los ecos para los usuarios humanos. Una persona habla mientras la otra escucha, y hablan de ida y vuelta. Un supresor de eco intenta determinar cuál es la dirección principal y permite que ese canal avance. En el canal inverso, aplica atenuación para bloquear o suprimir cualquier señal suponiendo que la señal sea eco. Aunque el supresor se ocupa eficazmente del eco, este enfoque conduce a varios problemas que pueden resultar frustrantes para ambas partes de una llamada.
En respuesta a esto, Bell Labs desarrolló la teoría del cancelador de eco a principios de la década de 1960, [4] [5] que luego dio lugar a canceladores de eco de laboratorio a fines de la década de 1960 y canceladores de eco comerciales en la década de 1980. [6] Un cancelador de eco funciona generando una estimación del eco a partir de la señal del hablante y resta esa estimación de la ruta de retorno. Esta técnica requiere un filtro adaptativo para generar una señal lo suficientemente precisa como para cancelar efectivamente el eco, donde el eco puede diferir del original debido a varios tipos de degradación en el camino. Desde la invención en AT&T Bell Labs [5], los algoritmos de cancelación de eco se han mejorado y perfeccionado. Como todos los procesos de cancelación de eco, estos primeros algoritmos fueron diseñados para anticipar la señal que inevitablemente volvería a ingresar a la ruta de transmisión y cancelarla.
Los rápidos avances en el procesamiento de señales digitales permitieron que los canceladores de eco fueran más pequeños y más rentables. En la década de 1990, los canceladores de eco se implementaron dentro de los conmutadores de voz por primera vez (en el Northern Telecom DMS-250 ) en lugar de como dispositivos independientes. La integración de la cancelación de eco directamente en el conmutador significó que los canceladores de eco podían activarse o desactivarse de manera confiable llamada por llamada, eliminando la necesidad de grupos troncales separados para llamadas de voz y datos. La tecnología de telefonía actual a menudo emplea canceladores de eco en dispositivos de comunicaciones pequeños o portátiles a través de un motor de voz de software , que proporciona cancelación del eco acústico o del eco residual introducido por un sistema de puerta de enlace PSTN de extremo lejano; dichos sistemas generalmente cancelan las reflexiones de eco con un retraso de hasta 64 milisegundos.
El proceso de cancelación de eco funciona de la siguiente manera:
El principal desafío para un cancelador de eco es determinar las características de respuesta del filtro que se aplicará a la señal del extremo lejano de manera que se asemeje al eco resultante del extremo cercano. El filtro es esencialmente un modelo del altavoz, el micrófono y los atributos acústicos de la sala. Los canceladores de eco deben ser adaptativos porque las características del altavoz y el micrófono del extremo cercano generalmente no se conocen de antemano. Los atributos acústicos de la sala del extremo cercano tampoco se conocen de antemano y pueden cambiar (por ejemplo, si el micrófono se mueve en relación con el altavoz o si las personas caminan por la sala provocando cambios en las reflexiones acústicas). [2] [7] Al utilizar la señal del extremo lejano como estímulo, los sistemas modernos utilizan un filtro adaptativo y pueden converger desde no proporcionar cancelación hasta 55 dB de cancelación en alrededor de 200 ms. [ cita requerida ]
La cancelación de eco por sí sola puede ser insuficiente en muchas aplicaciones. La cancelación y supresión de eco pueden funcionar en conjunto para lograr un rendimiento aceptable.
El eco se mide comoPérdida de retorno de eco (ERL). Es la relación, expresada endecibeles, entre la señal original y su eco.[8]Los valores altos significan que el eco es muy débil, mientras que los valores bajos significan que el eco es muy fuerte. Los valores negativos indican que el eco es más fuerte que la señal original, lo que, si no se controla, provocaríaretroalimentación de audio.
El rendimiento de un cancelador de eco se mide en términos de mejora de la pérdida de retorno de eco (ERLE), [3] [9], que es la cantidad de pérdida de señal adicional aplicada por el cancelador de eco. La mayoría de los canceladores de eco pueden aplicar una ERLE de entre 18 y 35 dB.
La pérdida total de señal del eco (ACOM) es la suma de ERL y ERLE. [9] [10]
Las fuentes de eco se encuentran en entornos cotidianos como:
En algunos de estos casos, el sonido del altavoz entra al micrófono casi inalterado. Las dificultades para cancelar el eco se deben a la alteración del sonido original por el espacio ambiental. Estos cambios pueden incluir la absorción de ciertas frecuencias por los muebles tapizados y la reflexión de diferentes frecuencias con distinta intensidad.
La implementación de AEC requiere experiencia en ingeniería y un procesador rápido, generalmente en forma de un procesador de señal digital (DSP); este costo en capacidad de procesamiento puede ser superior; sin embargo, muchos sistemas integrados tienen un AEC completamente funcional.
Los altavoces inteligentes y los sistemas de respuesta de voz interactiva que aceptan voz como entrada utilizan AEC mientras se reproducen las indicaciones de voz para evitar que el reconocimiento de voz del propio sistema reconozca falsamente las indicaciones repetidas y otras salidas.
Las líneas telefónicas estándar utilizan el mismo par de cables para enviar y recibir audio, lo que hace que una pequeña cantidad de la señal saliente se refleje. Esto resulta útil para las personas que hablan por teléfono, ya que proporciona una señal al hablante de que su voz está llegando a través del sistema. Sin embargo, esta señal reflejada causa problemas para un módem, que no puede distinguir entre una señal del módem remoto y el eco de su propia señal.
Por este motivo, los primeros módems de acceso telefónico dividían las frecuencias de las señales, de modo que los dispositivos de cada extremo utilizaban tonos diferentes, lo que permitía a cada uno ignorar cualquier señal en el rango de frecuencia que estaba utilizando para la transmisión. Sin embargo, esto reducía la cantidad de ancho de banda disponible para ambos lados.
La cancelación de eco mitigó este problema. Durante el período de establecimiento y negociación de la llamada, ambos módems envían una serie de tonos únicos y luego los escuchan para que regresen a través del sistema telefónico. Miden el tiempo de retardo total y luego configuran una línea de retardo para ese mismo período. Una vez que se completa la conexión, envían sus señales a las líneas telefónicas de manera normal, pero también a la línea de retardo. Cuando su señal se refleja de regreso, se mezcla con la señal invertida de la línea de retardo, que cancela el eco. Esto permitió que ambos módems usaran todo el espectro disponible, duplicando la velocidad posible.
Muchas empresas de telecomunicaciones también aplican la cancelación de eco a la propia línea y puede provocar la corrupción de los datos en lugar de mejorar la señal. Algunos conmutadores o convertidores telefónicos (como los adaptadores de terminales analógicos) desactivan la supresión o cancelación de eco cuando detectan los tonos de respuesta de 2100 o 2225 Hz asociados a dichas llamadas, de acuerdo con la recomendación G.164 o G.165 de la UIT-T .
Los módems ISDN y DSL que funcionan en frecuencias superiores a la banda de voz a través de cables telefónicos de par trenzado estándar también utilizan la cancelación automática de eco para permitir la comunicación de datos bidireccional simultánea. La complejidad computacional en la implementación del filtro adaptativo es mucho menor en comparación con la cancelación de eco de voz porque la señal de transmisión es un flujo de bits digitales. En lugar de una operación de multiplicación y una operación de suma para cada derivación en el filtro, solo se requiere la suma. Un esquema de cancelación de eco basado en una tabla de búsqueda en RAM [11] [12] elimina incluso la operación de suma simplemente direccionando una memoria con un flujo de bits de transmisión truncado para obtener la estimación del eco. La cancelación de eco ahora se implementa comúnmente con técnicas de Procesador de Señal Digital (DSP).
Algunos módems utilizan frecuencias de entrada y salida independientes o asignan intervalos de tiempo separados para la transmisión y la recepción a fin de eliminar la necesidad de la cancelación de eco. Las frecuencias más altas que superan los límites de diseño originales de los cables telefónicos sufren una importante distorsión de atenuación debido a las derivaciones en puente y a una adaptación de impedancia incompleta . A menudo se producen brechas de frecuencia profundas y estrechas que no se pueden solucionar con la cancelación de eco. Estas brechas se detectan y se trazan durante la negociación de la conexión.