UNIVERSIDAD DE BURGOS SERVICIO DE INFORMÁTICA Y COMUNICACIONES ÁREA DE SISTEMAS Información acerca del sistema de detección y clasificación de correo no deseado (spam) usado por la UBU ¿En qué consiste? El sistema de detección y clasificación consiste en una serie de filtros instalados en el servidor de correo que analizan el contenido del mensaje en busca de patrones que ayuden a clasificar el correo como legítimo (también llamado ham) o no deseado (el llamado spam o correo basura). Una vez analizado el mensaje se clasifica según los resultados del filtro, enviando el mensaje a una carpeta llamada “SPAM” en el caso de que sea detectado como tal, y a la bandeja de entrada en cualquier otro caso. ¿Cómo sabe el filtro qué mensajes son spam? El filtro consulta una base de datos para intentar clasificar los mensajes. Cuanto mejor sea esa base de datos más efectiva será la detección. En la UBU se utilizan dos bases de datos, una mantenida por el SIC y otra mantenida de forma automática según la clasificación del usuario. En la clasificación de los mensajes se usan ambas bases de datos, por lo que influye en gran medida lo que el usuario haya clasificado como spam. ¿Cómo se alimentan las bases de datos? La base de datos general la mantiene el SIC. En el Área de Sistemas se recogen muestras de mensajes “buenos” y “malos” que se procesan para actualizar la base de datos. La base de datos de cada usuario se mantiene de forma automática de la siguiente manera: ● Cuando un usuario recibe un correo clasificado como “bueno” éste se añade a la base de datos como ham (correo legítimo). ● Cuando un usuario recibe un correo clasificado como “malo” se añade a la base de datos como spam (correo basura). ● Cuando un correo es movido por el usuario a la carpeta “NO SPAM” el sistema “olvida” la clasificación anterior y lo aprende de nuevo como correo legítimo. Facultad de Ciencias, planta baja Plaza Misael Bañuelos s/n 09001 Burgos Telf.: 947 25 88 43 Fax: 947 25 88 47 e­mail: [email protected] UNIVERSIDAD DE BURGOS SERVICIO DE INFORMÁTICA Y COMUNICACIONES ÁREA DE SISTEMAS ● Cuando un correo es movido por el usuario a la carpeta “SPAM” el sistema “olvida” la clasificación anterior y lo aprende de nuevo como correo basura (spam). ¿Qué debo hacer si recibo spam en mi bandeja de entrada? Moverlo a la carpeta “SPAM”. De esta forma el sistema sabrá que ese mensaje no es bueno y ayudará en la clasificación de futuros mensajes. Si no lo hace el sistema aprenderá mal y dejará pasar mas spam. ¿Qué debo hacer si recibo un mensaje legítimo en la carpeta SPAM? Moverlo a la carpeta “NO SPAM”. De esta forma el sistema sabrá que no es spam y ayudará en la clasificación de futuros mensajes. Una vez que el sistema lo haya procesado será movido a la bandeja de entrada de forma automática. ¿Cuanto tarda el sistema en “aprender” lo que es spam y lo que no? Los mensajes de las carpetas “NO SPAM” y “SPAM” son procesados aproximadamente cada tres horas, a fin de no saturar los servidores. ¿Debo borrar el spam? Es aconsejable borrar los mensajes de correo no deseado siempre que se borren de la carpeta SPAM y no de la bandeja de entrada. Borrar el spam desde la bandeja de entrada hace que no se procese como spam y que éste sea aprendido como correo “bueno”, dando lugar a una peor detección. El spam consume espacio en el buzón, y por lo tanto aumenta la cuota usada. No obstante el servidor elimina periódicamente los mensajes de spam antiguos para que no ocupen demasiado. En ningún caso borre la carpeta “SPAM”, aunque ésta se genera de forma automática este proceso consume recursos del servidor. Si recibe una cantidad moderada de spam puede dejar que el sistema lo borre por usted una vez que lo haya procesado, pero sea consciente que buscar un mensaje legítimo en una carpeta abarrotada de spam es un trabajo tedioso. Lo recomendable sería borrar el spam que tenga uno o dos días a fin de que el sistema haya tenido tiempo de procesarlo. UNIVERSIDAD DE BURGOS SERVICIO DE INFORMÁTICA Y COMUNICACIONES ÁREA DE SISTEMAS Leo el correo usando POP3. ¿Cómo accedo a mi carpeta SPAM? A través del correo web accediendo a la dirección https://correoweb.ubu.es. Marco mensajes como spam, pero siguen llegando a mi bandeja de entrada ¿por qué? Esto normalmente ocurre porque los “spammers” (los responsables de enviar spam) redactan los mensajes haciendo que sean ligeramente diferentes. Muchas veces esas diferencias no se llegan a apreciar puesto que son cambios que no afectan al texto que se muestra. En otras ocasiones cambian ciertos caracteres o insertan espacios entre las letras que forman las palabras en un intento de “engañar” al filtro. Hay que tener en cuenta que la gran mayoría son profesionales que dedican mucho esfuerzo y recursos para inundar de spam los servidores. Recibo correspondencia en inglés y el sistema clasifica como spam estos mensajes ¿por qué? La mayoría de los mensajes de spam son en inglés, por lo cual el filtro algunas veces cree erróneamente que algunos mensajes en inglés son spam. Si el usuario no vuelve a clasificar los mensajes como correo “bueno” moviendo los mensajes a la carpeta “NO SPAM” acentúa este efecto al no permitir que el filtro aprenda. Hay que recordar que si no se mueven estos mensajes a la carpeta de no spam se quedan marcados como spam. UNIVERSIDAD DE BURGOS SERVICIO DE INFORMÁTICA Y COMUNICACIONES ÁREA DE SISTEMAS Información para usuarios avanzados ¿Qué cabeceras añade el sistema de detección de spam? El filtro de detección de spam añade la cabecera X-Bogosity, en la cual se especifica si el mensaje es Ham (bueno), Spam (malo) o Unsure (desconocido), seguido de una puntuación de 0 a 1 y de la versión del filtro. Por ejemplo: X-Bogosity: Ham, tests=bogofilter, spamicity=0.000000, version=1.1.3 La variable spamicity indica en una escala de 0 a 1 la clasificación de spam asignada por el filtro (0 = no spam, 1 = spam).