SpamBayes es un filtro antispam bayesiano escrito en Python que utiliza técnicas descritas por Paul Graham en su ensayo "Un plan para el spam". Posteriormente fue mejorado por Gary Robinson y Tim Peters , entre otros. [2]
La diferencia más notable entre un filtro bayesiano convencional y el filtro utilizado por SpamBayes es que existen tres clasificaciones en lugar de dos: spam, no spam (llamado ham en SpamBayes) e inseguro. El usuario entrena un mensaje como ham o spam; al filtrar un mensaje, los filtros de spam generan una puntuación para ham y otra para spam.
Si la puntuación de spam es alta y la de radioaficionado es baja, el mensaje se clasificará como spam. Si la puntuación de spam es baja y la de radioaficionado es alta, el mensaje se clasificará como radioaficionado. Si las puntuaciones son altas o bajas, el mensaje se clasificará como inseguro.
Este enfoque produce un número bajo de falsos positivos y falsos negativos , pero puede generar una serie de dudas que requieren una decisión humana.
Se ha trabajado en la aplicación de SpamBayes para filtrar contenido de Internet a través de un servidor web proxy . [3] [4] [5]