Información acerca del sistema de detección y clasificación de

Anuncio
UNIVERSIDAD DE BURGOS
SERVICIO DE INFORMÁTICA Y COMUNICACIONES
ÁREA DE SISTEMAS
Información acerca del sistema de detección y clasificación
de correo no deseado (spam) usado por la UBU
¿En qué consiste?
El sistema de detección y clasificación consiste en una serie de filtros instalados en el
servidor de correo que analizan el contenido del mensaje en busca de patrones que ayuden a clasificar el
correo como legítimo (también llamado ham) o no deseado (el llamado spam o correo basura).
Una vez analizado el mensaje se clasifica según los resultados del filtro, enviando el
mensaje a una carpeta llamada “SPAM” en el caso de que sea detectado como tal, y a la bandeja de
entrada en cualquier otro caso.
¿Cómo sabe el filtro qué mensajes son spam?
El filtro consulta una base de datos para intentar clasificar los mensajes. Cuanto mejor sea
esa base de datos más efectiva será la detección. En la UBU se utilizan dos bases de datos, una
mantenida por el SIC y otra mantenida de forma automática según la clasificación del usuario.
En la clasificación de los mensajes se usan ambas bases de datos, por lo que influye en
gran medida lo que el usuario haya clasificado como spam.
¿Cómo se alimentan las bases de datos?
La base de datos general la mantiene el SIC. En el Área de Sistemas se recogen muestras
de mensajes “buenos” y “malos” que se procesan para actualizar la base de datos.
La base de datos de cada usuario se mantiene de forma automática de la siguiente manera:
●
Cuando un usuario recibe un correo clasificado como “bueno” éste se añade a la
base de datos como ham (correo legítimo).
●
Cuando un usuario recibe un correo clasificado como “malo” se añade a la base de
datos como spam (correo basura).
●
Cuando un correo es movido por el usuario a la carpeta “NO SPAM” el sistema
“olvida” la clasificación anterior y lo aprende de nuevo como correo legítimo.
Facultad de Ciencias, planta baja Plaza Misael Bañuelos s/n 09001 Burgos
Telf.: 947 25 88 43 Fax: 947 25 88 47 e­mail: [email protected]
UNIVERSIDAD DE BURGOS
SERVICIO DE INFORMÁTICA Y COMUNICACIONES
ÁREA DE SISTEMAS
●
Cuando un correo es movido por el usuario a la carpeta “SPAM” el sistema “olvida”
la clasificación anterior y lo aprende de nuevo como correo basura (spam).
¿Qué debo hacer si recibo spam en mi bandeja de entrada?
Moverlo a la carpeta “SPAM”. De esta forma el sistema sabrá que ese mensaje no es bueno
y ayudará en la clasificación de futuros mensajes. Si no lo hace el sistema aprenderá mal y dejará pasar
mas spam.
¿Qué debo hacer si recibo un mensaje legítimo en la carpeta SPAM?
Moverlo a la carpeta “NO SPAM”. De esta forma el sistema sabrá que no es spam y ayudará
en la clasificación de futuros mensajes. Una vez que el sistema lo haya procesado será movido a la
bandeja de entrada de forma automática.
¿Cuanto tarda el sistema en “aprender” lo que es spam y lo que no?
Los mensajes de las carpetas “NO SPAM” y “SPAM” son procesados aproximadamente
cada tres horas, a fin de no saturar los servidores.
¿Debo borrar el spam?
Es aconsejable borrar los mensajes de correo no deseado siempre que se borren de la carpeta
SPAM y no de la bandeja de entrada. Borrar el spam desde la bandeja de entrada hace que no se
procese como spam y que éste sea aprendido como correo “bueno”, dando lugar a una peor detección.
El spam consume espacio en el buzón, y por lo tanto aumenta la cuota usada. No obstante el
servidor elimina periódicamente los mensajes de spam antiguos para que no ocupen demasiado. En
ningún caso borre la carpeta “SPAM”, aunque ésta se genera de forma automática este proceso consume
recursos del servidor.
Si recibe una cantidad moderada de spam puede dejar que el sistema lo borre por usted una
vez que lo haya procesado, pero sea consciente que buscar un mensaje legítimo en una carpeta
abarrotada de spam es un trabajo tedioso. Lo recomendable sería borrar el spam que tenga uno o dos
días a fin de que el sistema haya tenido tiempo de procesarlo.
UNIVERSIDAD DE BURGOS
SERVICIO DE INFORMÁTICA Y COMUNICACIONES
ÁREA DE SISTEMAS
Leo el correo usando POP3. ¿Cómo accedo a mi carpeta SPAM?
A través del correo web accediendo a la dirección https://correoweb.ubu.es.
Marco mensajes como spam, pero siguen llegando a mi bandeja de
entrada ¿por qué?
Esto normalmente ocurre porque los “spammers” (los responsables de enviar spam)
redactan los mensajes haciendo que sean ligeramente diferentes. Muchas veces esas diferencias no se
llegan a apreciar puesto que son cambios que no afectan al texto que se muestra. En otras ocasiones
cambian ciertos caracteres o insertan espacios entre las letras que forman las palabras en un intento de
“engañar” al filtro. Hay que tener en cuenta que la gran mayoría son profesionales que dedican mucho
esfuerzo y recursos para inundar de spam los servidores.
Recibo correspondencia en inglés y el sistema clasifica como spam
estos mensajes ¿por qué?
La mayoría de los mensajes de spam son en inglés, por lo cual el filtro algunas veces cree
erróneamente que algunos mensajes en inglés son spam. Si el usuario no vuelve a clasificar los
mensajes como correo “bueno” moviendo los mensajes a la carpeta “NO SPAM” acentúa este efecto al
no permitir que el filtro aprenda. Hay que recordar que si no se mueven estos mensajes a la carpeta de
no spam se quedan marcados como spam.
UNIVERSIDAD DE BURGOS
SERVICIO DE INFORMÁTICA Y COMUNICACIONES
ÁREA DE SISTEMAS
Información para usuarios avanzados
¿Qué cabeceras añade el sistema de detección de spam?
El filtro de detección de spam añade la cabecera X-Bogosity, en la cual se especifica si el
mensaje es Ham (bueno), Spam (malo) o Unsure (desconocido), seguido de una puntuación de 0 a 1 y
de la versión del filtro. Por ejemplo:
X-Bogosity: Ham, tests=bogofilter, spamicity=0.000000, version=1.1.3
La variable spamicity indica en una escala de 0 a 1 la clasificación de spam asignada por el
filtro (0 = no spam, 1 = spam).
Descargar