El spam de VoIP o SPIT ( spam a través de telefonía por Internet ) son llamadas telefónicas no solicitadas, marcadas automáticamente, generalmente utilizando tecnología de voz sobre protocolo de Internet (VoIP). [1]
Los sistemas VoIP, al igual que el correo electrónico y otras aplicaciones de Internet, son susceptibles de ser utilizados de forma indebida por personas malintencionadas que inician comunicaciones no solicitadas ni deseadas, como teleoperadores y personas que realizan llamadas de broma . Las tarifas de las llamadas VoIP son económicas y la tecnología ofrece herramientas prácticas, a menudo gratuitas, como Asterisk y otras aplicaciones.
La principal tecnología subyacente que impulsa esta amenaza es el Protocolo de inicio de sesión (SIP), [2] que es un estándar para las telecomunicaciones VoIP.
Se han ideado diversas técnicas para detectar llamadas de spam; algunas de ellas surten efecto incluso antes de que el destinatario haya respondido a la llamada para desconectarla. Estas técnicas se basan en el análisis estadístico de las características de la llamada [3] , como la dirección IP de origen, o las características de los mensajes de señalización y multimedia [4] .
El spam de VoIP se caracteriza por llamadas no solicitadas iniciadas por sistemas de voz sobre protocolo de Internet . El spammer intenta iniciar una sesión de voz y reproduce un mensaje grabado si el receptor responde. Las llamadas automáticas se pueden enviar automáticamente mediante software de telefonía, como Asterisk .
RFC 5039 [1] contiene algunos métodos básicos para la mitigación del spam telefónico a través de SIP:
Una identificación sólida del emisor de la llamada, como se describe, por ejemplo, en RFC 4474, [5] ayuda a mitigar el SPIT. En una red telefónica pública conmutada (PSTN), el identificador de llamada permite identificar al emisor de la llamada, pero al menos el identificador de llamada mostrado puede ser falsificado .
Se han propuesto varios métodos y marcos de mitigación de SPIT. La gran cantidad de trabajo sobre detección de spam en correos electrónicos no se aplica directamente aquí debido a la naturaleza en tiempo real de las llamadas de voz. Un estudio exhaustivo de la investigación de seguridad de voz sobre IP [1] (Capítulo IV b) proporciona una descripción general. Muchas propuestas se centran en la reputación y el comportamiento de las personas que llaman, mientras que algunas se centran en clasificadores de aprendizaje automático que utilizan características extraídas de las señales de control o los datos de la llamada. Un análisis estadístico del tráfico de señalización y, en particular, la frecuencia de la llamada se puede utilizar para detectar anomalías, observar y, finalmente, poner en la lista negra a las personas que llaman sospechosas. [3] Una herramienta de aprendizaje automático semisupervisada crea grupos de llamadas similares y un operador humano puede marcar cualquier grupo dado como spam. Un detector de spam de voz (VSD) [6] es un filtro de spam de varias etapas basado en la confianza y la reputación. El proyecto SPIDER [2] propone una arquitectura de mitigación de SPIT, [7] que utiliza una capa de detección que consta de varios módulos y una capa de decisión . El sistema VoIP SEAL [8] utiliza diferentes etapas. Después de un análisis de señalización en la primera etapa, los llamantes sospechosos son sometidos a pruebas (por ejemplo, Audio- CAPTCHAs ) y se les pide retroalimentación al llamado en etapas posteriores. SymRank [9] adapta el algoritmo PageRank y calcula la reputación de los suscriptores en función de las llamadas entrantes y salientes. Además, los valores atípicos en la duración total de la conversación y en las llamadas repetitivas y recíprocas se pueden utilizar para detectar llamantes sospechosos. [9]
La detección de SPIT puede hacer uso de sofisticados algoritmos de aprendizaje automático , incluidos algoritmos de aprendizaje automático semisupervisados . Un protocolo llamado pMPCK-Means [4] realiza la detección tan pronto como se establece la llamada, brindando la opción de colgar automáticamente una llamada sospechosa. Se basa en la noción de agrupamiento mediante el cual las llamadas con características similares se colocan en un grupo para SPIT o llamadas legítimas y se utiliza la entrada humana para marcar qué grupo corresponde a SPIT. Las características de las llamadas incluyen aquellas extraídas directamente del tráfico de señalización, como las direcciones de origen y destino, extraídas del tráfico de medios, como la proporción de silencio, y derivadas de las llamadas, como la duración y la frecuencia de las llamadas.
La detección y mitigación de SPIT también se puede basar únicamente en los datos de audio de la persona que llama. [10] [11] Este enfoque utiliza técnicas de identificación de audio (similares a la identificación de música ) para detectar llamadas con datos de audio idénticos, incluidas ciertas degradaciones (por ejemplo, ruido y diferentes códecs de audio). Se deriva una huella acústica robusta ( hashing perceptual ) de los parámetros espectrales de los datos de audio y las llamadas reproducidas se identifican mediante una comparación de huellas digitales. [12] Se ha desarrollado una solución prototipo dentro del proyecto VIAT.
Los investigadores Azad y Morla (2013) realizaron un estudio sobre la detección de spam mediante un enfoque mucho más preciso y seguro. Inventaron un nuevo esquema para detectar llamadas de spam sin interacción del usuario y revisando previamente el contenido del mensaje. Las estadísticas de varios experimentos mostraron que este nuevo sistema detectaba de manera efectiva a los spammers que llamaban a usuarios legítimos sin acceder a la información privada ni a la interacción del usuario. [13]
Hay poca información disponible sobre las implementaciones de medidas de mitigación de SPIT por parte de las compañías telefónicas . Algunos proveedores recientes de teléfonos inteligentes están incorporando la notificación de posible spam para llamadas entrantes, como Google en sus dispositivos Nexus Android [14] y Apple en su versión iOS 10. [15] En general, SPIT aún no se considera un problema tan crítico como el spam de correo electrónico . Un análisis automatizado del flujo de señalización de llamadas puede ayudar a descubrir SPIT. El software VoIP comercial para proveedores de servicios de comunicación puede incluir un análisis de comportamiento, por ejemplo, Acme Packet Palladion. Los parámetros e indicaciones relevantes de SPIT son, por ejemplo, una alta frecuencia de intentos de llamada, llamadas concurrentes, baja finalización de llamadas y baja duración promedio de llamadas.