Bogofilter es un filtro de correo que clasifica el correo electrónico como spam o no spam mediante un análisis estadístico del encabezado y el contenido (cuerpo) del mensaje. [1] El programa es capaz de aprender de las clasificaciones y correcciones del usuario. Fue escrito originalmente por Eric S. Raymond después de leer el artículo de Paul Graham "Un plan para el spam" y ahora lo mantiene junto con un grupo de colaboradores formado por David Relson, Matthias Andree [2] y Greg Louis.
La técnica estadística utilizada se conoce como filtrado bayesiano . El algoritmo principal de Bogofilter utiliza el parámetro f(w) y la técnica de chi-cuadrado inverso de Fisher que él describe.
Bogofilter puede ser ejecutado por un MDA o cliente de correo para clasificar los mensajes a medida que se entregan a los buzones de correo del destinatario, o puede ser utilizado por un MTA para clasificar los mensajes a medida que se reciben del servidor SMTP de envío. Bogofilter examina los tokens en el cuerpo y el encabezado del mensaje, y hace referencia a las listas de palabras almacenadas por BerkeleyDB , SQLite o QDBM para calcular una puntuación de probabilidad de que un mensaje nuevo sea spam. Bogofilter proporciona procesamiento para texto sin formato y HTML y admite la lectura de mensajes MIME de varias partes, incluidos base64, quoted-printable y texto o HTML codificados en uu. Bogofilter ignora los archivos adjuntos que no son texto, como las imágenes.
Es posible ajustar los algoritmos estadísticos de Bogofilter modificando varios coeficientes y otras configuraciones en su archivo de configuración, o utilizando la utilidad automatizada bogotune incluida con el software, que intenta optimizar varios coeficientes para maximizar la eficiencia del filtrado para un corpus particular de spam y no spam.
Las pruebas estándar realizadas en TREC 2005 muestran que Bogofilter se compara bien con sus competidores spambayes , CRM114 y DSPAM. Otros competidores incluyen, entre otros, Spamprobe y QSF.
Bogofilter está escrito en C y funciona en Linux , FreeBSD , NetBSD , OpenBSD , Solaris , Mac OS X , HP-UX , AIX y otras plataformas. Se distribuye bajo la licencia GNU GPL .
Se sabe que los siguientes clientes de correo electrónico admiten Bogofilter como backend de filtrado de spam:
Este artículo, o una revisión anterior del mismo, fue editado desde la página de inicio de bogofilter.