Entrenando a dspam
Como no tenemos otra, es necesario entrenar a dspam y enseñarle qué es correo y qué es basura, y para ello tenemos varias posibilidades:
- Establecemos unas carpetas en cada cuenta de correo que guarden lo que creemos que es spam y lo que creemos que no, y dejamos que dspam las explore a su manera y tiempo y aprenda de ello.
- Envíamos copias del correo a unas cuentas especiales con el mismo propósito, pero sabiendo que el aprendizaje es tan inmediato como el despacho del correo.
Creo que podemos tener las dos cosas funcionando en paralelo perfectamente, con el añadido de disponer de una base de datos de spam global para el casi seguro caso de que los usuarios ignoren tus recomendaciones y te toque a tí mantenerla.
Programas y utilerías
Las siguientes notas están pendientes de revisión, sobre todo en cuanto a efectos secundarios se refiere, y teniendo en cuenta que empleo la versión existente en Debian Etch, con todo lo que eso supone en cuanto a actualización.
Agente de filtrado
/usr/bin/dspamc --class=innocent --source=error --stdout
El programa dspamc
es el cliente (agente en la jerga del programa) que sirve
como pasarela entre el servidor de correo y el sistema de filtrado. Tiene
muchas opciones, pero me centro en este caso en las que sirve para entrenar al
filtro.
Recetario para maildrop
Usando direcciones de correo especiales
Todos los usuarios del sitio tiene ya reconocidas unas direcciones especiales para entrenar al filtro de spam. Estas direcciones se forman con un prefijo y el nombre de la cuenta de correo del usuario.
- 'spam-' es el prefijo escogido para indicar que el filtro debe aprender que el mensaje que llega a ella es basura.
- 'nospam-' es el prefijo para lo contrario. Un mensaje recibido en esa dirección instruye al filtro para que aprenda lo que es un correo válido y, dado que quizás el mensaje se ha modificado nos lo reenvía para posterior archivo.
Usando carpetas especiales
Vamos a crear la misma infraestructura para todos los usuarios del sitio, y situaremos las siguientes carpetas bajo su buzón de entrada:
Spam
es donde se guardará aquél correo que sea marcado como correo basura por el filtro. En ella aparecen las siguientes carpetas:EstoEsSpam
es el lugar al que moveremos ó copiaremos mensajes que sabemos que son spam y en donde el filtro aprenderá a reconocerlo. De los mensajes que aquí guardemos no recibiremos copia.NoEsSpam
es el lugar al que copiaremos mensajes que sabemos que no son spam y creemos que el filtro se ha equivocado. Él aprenderá en este sitio qué mensajes consideramos válidos y nos enviará una copia una vez los tenga.
Un trabajo ejecutado regularmente recorre estas carpetas y usa su contenido para entrenar al filtro, borrando después su contenido. Aún está por determinar el horario y la frecuencia.
Enlaces y referencias
- Bitácoras con experiencias en el tema:
- Colección de artículos en
unixcluster.dk
. - Nachos Rule! que cuenta que algunas direcciones ya están condenadas de por vida a recibir spam.
- Colección de artículos en
- Otros lugares con información relevante:
- Training DSPAM with scripts especializado más bien en OS/X pero con ejemplos válidos para aprender.