¿Cuál es el punto del spam gibberish?

61

Ocurro con bastante frecuencia en foros con mensajes de spam como:

  

La rúcula (Eruca sativa) es un verde trimestral, simulado o roquette.   Han sido los tiempos tradicionales, overclever 20 flat ha sido útil para   movimiento "foodie". Antes del impedimento de la década de 1990, la emoción era normal.   extranjero salvaje. El color ha naturalizado el mundo reaccionario, además de   Todo el elseloftier Europa además de América del Norte. La rúcula es todo   región mediterránea redonda, destetada de Marruecos y Portugal,   Líbano oriental y Turquía. Aproximadamente en la India, las semillas adultas son   Songeffortless Gargeer. El solvente es de la familia (Brassicaceae), la barra es   Bastante cohete de distancia, que es público ...

¿Cuál es el propósito detrás de este spam? Es molesto, sí, pero uno asume que el spammer tiene otro propósito que no sea simplemente molestar para hacer el esfuerzo de hacer esto. No veo ninguna URL ni enlaces en el mensaje, y no tengo un formato aparentemente "divertido" que pueda explotar algo.

¿Esto está tratando de influir de alguna manera en los rastreadores web? (Y, de ser así, ¿para qué?) ¿Explota de alguna manera algún tipo de debilidad en el software del foro? ¿Qué?

Añadido: Realmente no está relacionado con la pregunta original, más bien un comentario tangencial, pero pensé que valdría la pena mantenerlo en el mismo lugar, en caso de que alguien más lo busque:

La naturaleza de las publicaciones "extrañas" en el foro en el que estoy pensando principalmente ( enlace ) ha cambiado en gran medida. Lo que obtenemos ahora (una vez / dos veces por semana) son publicaciones que repasan los detalles de publicaciones anteriores en el hilo (a menudo un hilo muy antiguo), o tal vez los detalles obtenidos de una búsqueda en la web sobre el tema del hilo, pero generalmente no tienen sentido (en es mejor la naturaleza de "yo también") y el inglés, aunque técnicamente adecuado, es un peinado y, evidentemente, no el de un hablante de inglés (ni británico, estadounidense, indio ni africano, todos cuyos dialectos soy al menos familiar) con).

Mi mejor suposición es que son personas, probablemente en China, quienes están aprendiendo inglés y están usando el foro como una especie de prueba, para ver si su publicación no se detecta. No sé, sin embargo, si esto es simplemente un juego, una prueba para una clase de inglés o una prueba / práctica para un spammer aspirante. (Es poco probable que estén tratando de "ganarse el favor" con el filtro de correo no deseado, ya que la cosa ("Mollom") es notoriamente escamosa y felizmente deja pasar el correo basura en el primer intento mientras rechaza las publicaciones legítimas).

Pero espera, ¡hay más!

Durante aproximadamente el año pasado, el foro del que hablo ha sido bombardeado regularmente (al menos semanalmente, y en ocasiones varias veces al día, dos veces hasta ahora esta mañana) con mensajes como:

  

Unidades de cocina en venta. Treinta pantallas de exhibición Ex para borrar.   www. e x d i s p l a y k i t c h e n s 1 .co.uk £ 595 Cada uno con electrodomésticos.

(la URL está un poco dañada para no animar a estas personas).

Al parecer, este es un importante spammer que opera fuera de Europa (y nuestro foro está orientado aproximadamente en un 99% a los EE. UU.), por lo que no tiene sentido en el mejor de los casos. Lo más extraño es que el spam constante aparentemente ha "envenenado" la URL de Google (y probablemente otros motores de búsqueda), por lo que tienes que deletrear la URL para obtener un "hit".

(La otra cosa extraña, por supuesto, es que los operadores del sistema parecen incapaces de bloquear esto, aunque la URL sea siempre la misma.)

Otra pregunta -

Como, como observé anteriormente, las publicaciones de "spam de cocina" (también en docenas de otros BBs) aparentemente han "envenenado" el sitio web asociado de Google, ¿es posible que el spam realmente intente hacer esto? , y es instigado por alguien (¿un competidor?) que desea mal para ese sitio web?

    
pregunta Hot Licks 11.03.2012 - 04:51
fuente

4 respuestas

100

Están tratando de hacer envenenamiento bayesiano.

Al enviar muchas palabras correctas y algunas palabras que se usan en el spam, como viagra, esas palabras reciben una notificación de spam más baja (con el tiempo).

Esto significa que después de un tiempo pueden obtener spam real con enlaces al filtro.

    
respondido por el Lucas Kauffman 11.03.2012 - 10:27
fuente
26

Mis observaciones indican que este tipo de correo no deseado ha sido la primera publicación de un usuario recién creado. Después de algunos de este tipo, el tipo normal con enlaces incluidos se inicia.

Mis conjeturas sobre el propósito son:

  1. Software antispam engañoso que se concentra en las primeras publicaciones.
  2. Eliminar las diez primeras publicaciones para que puedan publicar enlaces. Algún software de foro lo hace cumplir.
  3. Relleno de palabras clave del motor de búsqueda. No veo ninguna palabra clave evidente en su muestra, pero la tengo en los foros que ejecuto.
respondido por el Ladadadada 11.03.2012 - 09:50
fuente
9

(Descargo de responsabilidad: estoy en la industria antispam pero no estoy representando oficialmente a mi empleador)

Hay dos tipos de spam en esta pregunta.

Los primeros dos ejemplos ("arugula" y "parroted comments") son Envenenamiento bayesiano .

El envenenamiento bayesiano es un intento de ocultar el contenido de spam entre el contenido de jamón, que aspira a confundir los filtros de spam de aprendizaje automático. En realidad no funciona .

El tercer ejemplo ("unidades de cocina") no tiene nada fuera de tema (por ejemplo, citas al azar como los dos primeros ejemplos), y es bastante breve. La intoxicación por Bayes se define por su contenido fuera de tema o no secuencial y casi siempre es bastante detallada, por lo que no es una intoxicación por Bayes.

  
    

Unidades de cocina en venta. Treinta pantallas de exhibición Ex para borrar. www. e x d i s p l a y k i t c h e n s 1 .co.uk £ 595 Cada uno con electrodomésticos.

  

Esto es spam con raquetas de nieve , que se denomina después de los zapatos gigantes con forma de canasta que distribuyen su peso a través de la nieve y así evitan que se hunda en la nieve con cada paso. Esto deja una huella más ligera y, por lo tanto, es más difícil de rastrear. El spam con raquetas de nieve aspira a pisar ligeramente y ser más difícil de notar.

  

(la URL está un poco dañada para no animar a estas personas).

Esa advertencia es realmente importante. Las raquetas de nieve tienden a no ofuscar mucho sus enlaces (ya que las víctimas tienen menos probabilidades de hacer clic). En su lugar, el dominio se usa tan brevemente que el correo no deseado ya ha llegado a su bandeja de entrada para cuando DNSBLBL URI pueda en la lista negra it.

El spam con raquetas de nieve generalmente tiene un cuerpo corto, está vendiendo algo y pretende ser un vendedor algo legítimo. La generación actual de raquetas de nieve se limita a elementos moralmente limpios (como unidades de cocina o mangueras de jardín) en lugar de elementos moralmente cuestionables (como pornografía o drogas), pero esto podría cambiar fácilmente.

Originalmente, el spam con raquetas de nieve tenía un volumen muy bajo para evadir el aviso de las trampas de spam, pero los emisores de spam han aprendido que debido a que los filtros alimentados con trampas (como los DNSBL) tardan unos minutos en propagar su conocimiento, un volumen muy alto solo funcionaría bien si toda la campaña de spam completa primero. Esto encaja con el principio de "pisada ligera" que dio nombre a esta clase de spam, aunque hoy en día es menos aplicable.

    
respondido por el Adam Katz 28.03.2015 - 03:19
fuente
1

La publicación podría estar bien clasificada para una determinada palabra clave en Google. Unos días después de que se escriba la publicación, el autor puede agregar un enlace a la firma de la cuenta.

    
respondido por el Christian 20.12.2013 - 16:06
fuente

Lea otras preguntas en las etiquetas