Lo agregaré a la respuesta de @Tom Leek con un poco más de información específica sobre cómo uno de los filtros de spam abiertos más comunes en el mercado (spamAssassin) verifica si algo es spam. En su núcleo, es un conjunto simple de reglas (las predeterminadas para la última versión de spamd se pueden encontrar en enlace ), algunos con controles muy simplistas. Tome, por ejemplo, la regla de que su mensaje de spam específico podría intentar pasar si hay una imagen en el correo electrónico (los spammers tienden a saber cómo usar las balizas):
HTML_IMAGE_ONLY_32 : HTML: imágenes con 2800-3200 bytes de palabras
(He visto correos electrónicos muy similares a los que mencionó con una baliza: un png invisible 1x1 alojado en un servidor remoto, que se usa para saber si ha abierto el correo electrónico)
El específico no es necesariamente un caso de envenenamiento por Bayes, ya que solo los filtros de spam terribles registran una palabra de 5 líneas como palabra. Simplemente está intentando almacenar contenido en búfer, ya que algunas reglas de filtro de correo no deseado funcionan con la regla "muy breve (no solicitada) correo electrónico = incorrecto".
Además, ciertos filtros de spam también están configurados para diluir los puntajes de penalización (spampoints). Este no es el caso para la mayoría de los servidores, ya que suele ser una muy mala idea, debido a la razón que se resaltó anteriormente: al rellenar suficientes palabras "buenas", puede convertir una puntuación de spam de +10 en una puntuación de spam de +0.5. Esto es trivial: copiar y pegar desde wikipedia.