¿Es este un tipo de envenenamiento bayesiano?

4

He estado leyendo mi correo no deseado últimamente, y hoy recibí esto:

Para: mi correo electrónico real, pero con un nombre encontrado aquí: tel2name.com (solo se encuentra en Google)

Asunto: un extracto aparentemente aleatorio de una página web encontrada aquí: (solo se encuentra en Google) enlace

citando "RCA" que en este caso, se refiere a: rca nalytics (punto com)

El cuerpo mismo es un extracto de esta página: enlace , uno frase que habla de: Gadsden Purchase, filibustering, y Washington.

¿Cuál puede ser el objetivo de esto? No entiendo qué beneficio pueden obtener al enviar esto, porque no se parece al envenenamiento bayesiano.

Además, el cuerpo es: Codificación de transferencia de contenido: base64

    
pregunta alecail 21.01.2015 - 21:24
fuente

1 respuesta

1

Sin más información (considere pegar el correo electrónico completo en un pastebin o gist), no puedo decirle de manera concluyente cuál es ese mensaje, pero según su descripción, sí, es probable que el spam sea un intento de envenenamiento .

Cuando ves un montón de galimatías o citas sin sentido o fuera de contexto, estás viendo un destructor de hachís o envenenamiento bayesiano.

Fuzzy hashing como Razor miden varias características de los mensajes y resumen cada medida en una pequeña cadena ( "hash difuso") que luego puede compararse con hashes difusos de spam conocido. Se asume que los partidos están en la misma campaña de spam.

Hash Busters intenta cambiar el contenido suficiente para evitar que los hashes difusos de una campaña de spam coincidan. Esta técnica puede funcionar, pero algunos algoritmos de hash difuso están diseñados específicamente para ser robustos, ignorando grandes franjas de cuerpos de mensajes e incluso utilizando hashes compuestos por heurísticas indicativas de destructores de hash.

Detección Bayesiana de correo no deseado calcula las probabilidades de correo no deseado frente al correo legítimo ("ham") en las frecuencias observadas de cada palabra en ham y spam (por ejemplo, "v1agra" es muy spam, pero "Niagara" es muy hammy). Estos se combinan en una probabilidad de spam para todo el mensaje, que se considera como spam en un determinado umbral.

Envenenamiento por Bayesiano intenta agregar contenido que sea posible que aparezca en el jamón. La teoría es que la probabilidad de spam se verá disminuida por la inclusión de un montón de palabras hammy. Afortunadamente, este no es realmente el caso. Debido a que Bayes está constantemente capacitado en el spam no capturado, aprenderá que estas distracciones son irrelevantes y pondrá más énfasis en el contenido restante que solo se ve en el spam. En la mayoría de los casos, realmente aprenderá que el envenenamiento bayesiano es en sí mismo un signo de spam.

Si bien el envenenamiento bayesiano puede ser efectivo para combatir el hachís, es contraproducente para envenenar los filtros bayesianos; Una de las mejores herramientas contra el correo no deseado para combatir tanto los piropos como el envenenamiento bayesiano es: Detección de correo no deseado bayesiano.

Obtenga más información sobre el envenenamiento bayesiano

    
respondido por el Adam Katz 26.03.2015 - 22:05
fuente

Lea otras preguntas en las etiquetas