Supresión y cancelación de eco

La supresión y cancelación de eco son métodos utilizados en telefonía para mejorar la calidad de la voz al evitar que se genere eco o eliminarlo una vez que ya está presente. Además de mejorar la calidad subjetiva del audio, la supresión de eco aumenta la capacidad lograda mediante la supresión del silencio al evitar que el eco viaje a través de una red de telecomunicaciones . Los supresores de eco se desarrollaron en la década de 1950 en respuesta al primer uso de satélites para telecomunicaciones.

Los métodos de supresión y cancelación de eco se denominan comúnmente supresión de eco acústico ( AES ) y cancelación de eco acústico ( AEC ), y más raramente cancelación de eco de línea ( LEC ). En algunos casos, estos términos son más precisos, ya que existen varios tipos y causas de eco con características únicas, incluido el eco acústico (sonidos de un altavoz que se reflejan y graban mediante un micrófono, que pueden variar sustancialmente con el tiempo) y el eco de línea (impulsos eléctricos causados, por ejemplo, por el acoplamiento entre los cables de envío y recepción, desajustes de impedancia, reflexiones eléctricas, etc., ^[1] que varía mucho menos que el eco acústico). En la práctica, sin embargo, se utilizan las mismas técnicas para tratar todos los tipos de eco, por lo que un cancelador de eco acústico puede cancelar el eco de línea así como el eco acústico. AEC en particular se utiliza comúnmente para referirse a los canceladores de eco en general, independientemente de si fueron diseñados para eco acústico, eco de línea o ambos.

Aunque los supresores de eco y los canceladores de eco tienen objetivos similares (evitar que una persona que habla escuche el eco de su propia voz), los métodos que utilizan son diferentes:

Los supresores de eco funcionan detectando una señal de voz que va en una dirección en un circuito y luego silenciando o atenuando la señal en la otra dirección. Por lo general, el supresor de eco en el extremo más alejado del circuito realiza este silenciamiento cuando detecta una voz que proviene del extremo más cercano del circuito. Este silenciamiento evita que el hablante escuche su propia voz que regresa desde el extremo más alejado.
La cancelación de eco implica reconocer primero la señal transmitida originalmente que reaparece, con cierto retraso, en la señal transmitida o recibida. Una vez que se reconoce el eco, se puede eliminar sustrayéndolo de la señal transmitida o recibida. Esta técnica generalmente se implementa digitalmente utilizando un procesador de señal digital o software, aunque también se puede implementar en circuitos analógicos. ^[2]

Las normas ITU G.168 y P.340 describen los requisitos y pruebas para canceladores de eco en aplicaciones digitales y PSTN , respectivamente.

Historia

En telefonía , el eco es la copia reflejada de la voz de una persona que se escucha algún tiempo después. Si el retraso es bastante significativo (más de unos pocos cientos de milisegundos), se considera molesto. Si el retraso es muy pequeño (decenas de milisegundos o menos ^[3] ), el fenómeno se llama efecto local . Si el retraso es ligeramente mayor, alrededor de 50 milisegundos, los humanos no pueden escuchar el eco como un sonido distinto, sino que escuchan un efecto de coro . ^[3]

En los primeros tiempos de las telecomunicaciones, se utilizaba la supresión de eco para reducir la naturaleza desagradable de los ecos para los usuarios humanos. Una persona habla mientras la otra escucha, y hablan de ida y vuelta. Un supresor de eco intenta determinar cuál es la dirección principal y permite que ese canal avance. En el canal inverso, aplica atenuación para bloquear o suprimir cualquier señal suponiendo que la señal sea eco. Aunque el supresor se ocupa eficazmente del eco, este enfoque conduce a varios problemas que pueden resultar frustrantes para ambas partes de una llamada.

Doble conversación: es bastante normal en una conversación que ambas partes hablen al mismo tiempo, al menos brevemente. Debido a que cada supresor de eco detectará la energía de la voz que viene del otro extremo del circuito, el efecto normal sería que se inserte una pérdida en ambas direcciones a la vez, bloqueando efectivamente a ambas partes. Para evitar esto, los supresores de eco se pueden configurar para detectar la actividad de voz del hablante del extremo cercano y para que no inserten pérdida (o inserten una pérdida menor) cuando tanto el hablante del extremo cercano como el del extremo lejano estén hablando. Esto, por supuesto, anula temporalmente el efecto principal de tener un supresor de eco.
Recorte: dado que el supresor de eco inserta y elimina pérdidas alternativamente, con frecuencia se produce un pequeño retraso cuando un nuevo orador comienza a hablar, lo que da como resultado el recorte de la primera sílaba del discurso de ese orador.
Sin eco: si el interlocutor del otro extremo de una llamada se encuentra en un entorno ruidoso, el interlocutor del extremo cercano oirá ese ruido de fondo mientras el interlocutor del otro extremo esté hablando, pero el supresor de eco suprimirá ese ruido de fondo cuando el interlocutor del extremo cercano empiece a hablar. La repentina ausencia de ruido de fondo da al usuario del extremo cercano la impresión de que la línea se ha cortado.

En respuesta a esto, Bell Labs desarrolló la teoría del cancelador de eco a principios de la década de 1960, ^[4]^[5] que luego dio lugar a canceladores de eco de laboratorio a fines de la década de 1960 y canceladores de eco comerciales en la década de 1980. ^[6] Un cancelador de eco funciona generando una estimación del eco a partir de la señal del hablante y resta esa estimación de la ruta de retorno. Esta técnica requiere un filtro adaptativo para generar una señal lo suficientemente precisa como para cancelar efectivamente el eco, donde el eco puede diferir del original debido a varios tipos de degradación en el camino. Desde la invención en AT&T Bell Labs ^[5], los algoritmos de cancelación de eco se han mejorado y perfeccionado. Como todos los procesos de cancelación de eco, estos primeros algoritmos fueron diseñados para anticipar la señal que inevitablemente volvería a ingresar a la ruta de transmisión y cancelarla.

Los rápidos avances en el procesamiento de señales digitales permitieron que los canceladores de eco fueran más pequeños y más rentables. En la década de 1990, los canceladores de eco se implementaron dentro de los conmutadores de voz por primera vez (en el Northern Telecom DMS-250 ) en lugar de como dispositivos independientes. La integración de la cancelación de eco directamente en el conmutador significó que los canceladores de eco podían activarse o desactivarse de manera confiable llamada por llamada, eliminando la necesidad de grupos troncales separados para llamadas de voz y datos. La tecnología de telefonía actual a menudo emplea canceladores de eco en dispositivos de comunicaciones pequeños o portátiles a través de un motor de voz de software , que proporciona cancelación del eco acústico o del eco residual introducido por un sistema de puerta de enlace PSTN de extremo lejano; dichos sistemas generalmente cancelan las reflexiones de eco con un retraso de hasta 64 milisegundos.

Operación

El proceso de cancelación de eco funciona de la siguiente manera:

Se envía una señal del extremo lejano al sistema.
Se reproduce la señal del extremo lejano.
La señal del extremo lejano se filtra y se retrasa para parecerse a la señal del extremo cercano.
La señal del extremo lejano filtrada se resta de la señal del extremo cercano.
La señal resultante representa los sonidos presentes en la habitación excluyendo cualquier sonido directo o reverberado.

El principal desafío para un cancelador de eco es determinar las características de respuesta del filtro que se aplicará a la señal del extremo lejano de manera que se asemeje al eco resultante del extremo cercano. El filtro es esencialmente un modelo del altavoz, el micrófono y los atributos acústicos de la sala. Los canceladores de eco deben ser adaptativos porque las características del altavoz y el micrófono del extremo cercano generalmente no se conocen de antemano. Los atributos acústicos de la sala del extremo cercano tampoco se conocen de antemano y pueden cambiar (por ejemplo, si el micrófono se mueve en relación con el altavoz o si las personas caminan por la sala provocando cambios en las reflexiones acústicas). ^[2]^[7] Al utilizar la señal del extremo lejano como estímulo, los sistemas modernos utilizan un filtro adaptativo y pueden converger desde no proporcionar cancelación hasta 55 dB de cancelación en alrededor de 200 ms. ^{[ cita requerida ]}

La cancelación de eco por sí sola puede ser insuficiente en muchas aplicaciones. La cancelación y supresión de eco pueden funcionar en conjunto para lograr un rendimiento aceptable.

Cuantificación del eco

El eco se mide comoPérdida de retorno de eco (ERL). Es la relación, expresada endecibeles, entre la señal original y su eco.^[8]Los valores altos significan que el eco es muy débil, mientras que los valores bajos significan que el eco es muy fuerte. Los valores negativos indican que el eco es más fuerte que la señal original, lo que, si no se controla, provocaríaretroalimentación de audio.

El rendimiento de un cancelador de eco se mide en términos de mejora de la pérdida de retorno de eco (ERLE), ^[3]^[9], que es la cantidad de pérdida de señal adicional aplicada por el cancelador de eco. La mayoría de los canceladores de eco pueden aplicar una ERLE de entre 18 y 35 dB.

La pérdida total de señal del eco (ACOM) es la suma de ERL y ERLE. ^[9]^[10]

Usos actuales

Las fuentes de eco se encuentran en entornos cotidianos como:

Sistemas telefónicos manos libres para automóvil
Un teléfono estándar o un teléfono celular en modo altavoz
Altavoces autónomos dedicados
Se instalaron sistemas de salas de conferencias que utilizan altavoces de techo y micrófonos en la mesa.
Acoplamiento físico donde las vibraciones del altavoz se transfieren al micrófono a través de la carcasa del auricular .

En algunos de estos casos, el sonido del altavoz entra al micrófono casi inalterado. Las dificultades para cancelar el eco se deben a la alteración del sonido original por el espacio ambiental. Estos cambios pueden incluir la absorción de ciertas frecuencias por los muebles tapizados y la reflexión de diferentes frecuencias con distinta intensidad.

La implementación de AEC requiere experiencia en ingeniería y un procesador rápido, generalmente en forma de un procesador de señal digital (DSP); este costo en capacidad de procesamiento puede ser superior; sin embargo, muchos sistemas integrados tienen un AEC completamente funcional.

Los altavoces inteligentes y los sistemas de respuesta de voz interactiva que aceptan voz como entrada utilizan AEC mientras se reproducen las indicaciones de voz para evitar que el reconocimiento de voz del propio sistema reconozca falsamente las indicaciones repetidas y otras salidas.

Módems

Las líneas telefónicas estándar utilizan el mismo par de cables para enviar y recibir audio, lo que hace que una pequeña cantidad de la señal saliente se refleje. Esto resulta útil para las personas que hablan por teléfono, ya que proporciona una señal al hablante de que su voz está llegando a través del sistema. Sin embargo, esta señal reflejada causa problemas para un módem, que no puede distinguir entre una señal del módem remoto y el eco de su propia señal.

Por este motivo, los primeros módems de acceso telefónico dividían las frecuencias de las señales, de modo que los dispositivos de cada extremo utilizaban tonos diferentes, lo que permitía a cada uno ignorar cualquier señal en el rango de frecuencia que estaba utilizando para la transmisión. Sin embargo, esto reducía la cantidad de ancho de banda disponible para ambos lados.

La cancelación de eco mitigó este problema. Durante el período de establecimiento y negociación de la llamada, ambos módems envían una serie de tonos únicos y luego los escuchan para que regresen a través del sistema telefónico. Miden el tiempo de retardo total y luego configuran una línea de retardo para ese mismo período. Una vez que se completa la conexión, envían sus señales a las líneas telefónicas de manera normal, pero también a la línea de retardo. Cuando su señal se refleja de regreso, se mezcla con la señal invertida de la línea de retardo, que cancela el eco. Esto permitió que ambos módems usaran todo el espectro disponible, duplicando la velocidad posible.

Muchas empresas de telecomunicaciones también aplican la cancelación de eco a la propia línea y puede provocar la corrupción de los datos en lugar de mejorar la señal. Algunos conmutadores o convertidores telefónicos (como los adaptadores de terminales analógicos) desactivan la supresión o cancelación de eco cuando detectan los tonos de respuesta de 2100 o 2225 Hz asociados a dichas llamadas, de acuerdo con la recomendación G.164 o G.165 de la UIT-T .

Los módems ISDN y DSL que funcionan en frecuencias superiores a la banda de voz a través de cables telefónicos de par trenzado estándar también utilizan la cancelación automática de eco para permitir la comunicación de datos bidireccional simultánea. La complejidad computacional en la implementación del filtro adaptativo es mucho menor en comparación con la cancelación de eco de voz porque la señal de transmisión es un flujo de bits digitales. En lugar de una operación de multiplicación y una operación de suma para cada derivación en el filtro, solo se requiere la suma. Un esquema de cancelación de eco basado en una tabla de búsqueda en RAM ^[11]^[12] elimina incluso la operación de suma simplemente direccionando una memoria con un flujo de bits de transmisión truncado para obtener la estimación del eco. La cancelación de eco ahora se implementa comúnmente con técnicas de Procesador de Señal Digital (DSP).

Algunos módems utilizan frecuencias de entrada y salida independientes o asignan intervalos de tiempo separados para la transmisión y la recepción a fin de eliminar la necesidad de la cancelación de eco. Las frecuencias más altas que superan los límites de diseño originales de los cables telefónicos sufren una importante distorsión de atenuación debido a las derivaciones en puente y a la adaptación incompleta de la impedancia . A menudo se producen brechas de frecuencia profundas y estrechas que no se pueden solucionar con la cancelación de eco. Estas brechas se detectan y se trazan durante la negociación de la conexión.

Véase también

Referencias

^ "Octasic: mejora de la calidad de voz y cancelación de eco". Archivado desde el original el 21 de agosto de 2014. Consultado el 14 de abril de 2014 .
^ ab Eneroth, Peter (2001). Cancelación de eco acústico estereofónico: teoría e implementación (PDF) (Tesis). Universidad de Lund. ISBN 91-7874-110-6. ISSN 1402-8662 . Consultado el 25 de junio de 2015 .
^ abc "Eco en sistemas de voz sobre IP" . Consultado el 2 de julio de 2014 .
^ Sondhi, Man Mohan (marzo de 1967). "Un cancelador de eco adaptativo" (PDF) . Bell System Technical Journal . 46 (3): 497–511. doi :10.1002/j.1538-7305.1967.tb04231.x. Archivado desde el original (PDF) el 16 de abril de 2014 . Consultado el 14 de abril de 2014 .
^ ab US 3500000, Kelly Jr., John L., "Cancelador de eco autoadaptativo", publicado el 10 de marzo de 1970, asignado a Bell Telephone Laboratories, Inc.
^ Murano, Kazuo; Unagami, Shigeyuki; Amano, Fumio (enero de 1990). «Cancelación de Eco y Aplicaciones» (PDF) . Revista de comunicaciones IEEE . 28 (1): 49–55. doi : 10.1109/35.46671. ISSN 0163-6804. S2CID 897792 . Consultado el 14 de abril de 2014 .
^ Åhgren, Per (noviembre de 2005). "Cancelación de eco acústico y detección de habla simultánea mediante respuestas de impulso estimadas de altavoces" (PDF) . Transacciones IEEE sobre procesamiento de voz y audio . 13 (6): 1231–1237. CiteSeerX 10.1.1.530.4556 . doi :10.1109/TSA.2005.851995. S2CID 2575877.
^ "¿Qué es la pérdida de retorno de eco (ERL) y cómo afecta la calidad de la voz?". Archivado desde el original el 26 de junio de 2015.
^ ab "Análisis de eco para voz sobre IP". Cisco Systems . Consultado el 2 de julio de 2014 .
^ Kosanovic, Bogdan (11 de abril de 2002). "Cancelación de eco, parte 1: conceptos básicos y cancelación de eco acústico". EE Times . Consultado el 7 de julio de 2014 .
^ Holte, N.; Stueflotten, S. (1981). "Un nuevo cancelador de eco digital para líneas de abonado de dos cables". IEEE Transactions on Communications . 29 (11): 1573–1581. doi :10.1109/TCOM.1981.1094923. ISSN 1558-0857.
^ US 4237463, Bjor, Håkon E. & Raad, Bjørn H., "Acoplador direccional", publicado el 2 de diciembre de 1980, asignado a Elektrisk Bureau A/S

Enlaces externos

"Cancelación de eco". Consorcio Internacional de Ingeniería. Archivado desde el original el 8 de marzo de 2007.
"Tutorial básico de Echo". Ditech Networks. Archivado desde el original el 10 de julio de 2011.
"Cancelación de eco acústico Q-Sys" (PDF) . Productos de audio QSC . Consultado el 28 de julio de 2016 .