Sitios que permiten contenido generado por el usuario

4

¿Hay alguna manera de identificar qué sitios populares albergarán contenido arbitrario generado por el usuario?

Estoy haciendo un análisis para detectar sitios de phishing. Sería bueno utilizar la popularidad de un sitio web como una forma de eliminar sitios que, lo más probable, no son sitios de phishing. Por ejemplo, es muy poco probable que Google.com y Amazon.com alojen un sitio de phishing. Por lo tanto, los sitios muy populares pueden ser considerados de confianza. Sin embargo, la popularidad no es un proxy perfecto para la confianza, si algunos sitios populares permiten alojar contenido de usuarios arbitrarios. Por ejemplo, Wordpress.com, Github.io, Googleusercontent.com y Wix.com probablemente no deberían considerarse de confianza, ya que alojan contenido generado por el usuario y, por lo tanto, podrían usarse para organizar un ataque de phishing.

¿Hay alguna forma de obtener una lista de dichos sitios? Solo me preocupo por esto para los sitios más populares (por ejemplo, el top 1000 de Alexa). ¿Hay algún servicio de clasificación de confianza o reputación del sitio web que proporcione esta información?

    
pregunta D.W. 21.03.2016 - 05:42
fuente

2 respuestas

1

En el nivel más básico: no. Cualquier sitio puede optar por alojar cualquier contenido y tener diferentes niveles de saneamiento del contenido generado por el usuario y varios niveles de seguridad. Incluso Google tiene servicios que podrían usarse para el phishing, sin importar lo difícil que sea hacerlo. Incluso si un sitio no lo permite, hay ataques, como envenenamiento de DNS, inyección de SQL, ataques de escalamiento, etc., que podrían dejar un sitio normalmente seguro en un estado malicioso. Incluso el propio sitio web de la NASA fue hackeado una vez, y podría haber hecho mucho daño si los atacantes hubieran tenido la intención de hacerlo.

    
respondido por el phyrfox 21.03.2016 - 08:31
fuente
0

La investigación para comprender, documentar y proteger mejor contra el phishing es, por supuesto, deseable, pero me gustaría repetir la respuesta anterior de que a nivel de dominio esto es probablemente imposible sin hacer un análisis de contenido, ya que equivale a para probar una información negativa y completa para la que no existe.

La presencia o ausencia de contenido generado por el usuario en el contenido entregado por una empresa conlleva disposiciones adicionales en una política de privacidad, específicamente para citar leyes que protegen a las empresas contra demandas basadas en contenido creado por usuarios que no representa la política de la empresa. .

Probablemente es posible analizar un conjunto de políticas de privacidad y determinar cuáles sugieren la presencia de contenido generado por el usuario, pero que se asigna solo a las empresas, no a los dominios.

Generar la lista completa de dominios y subdominios en posesión de una empresa es un arte, ya que esa información no es expresamente pública y debe ser adivinada o deducida. En el contexto de un dominio específico, una política dada puede aplicarse a muchos dominios en posesión de la empresa que en última instancia es responsable de la política, y no necesariamente se aplica específicamente al dominio bajo el cual se aloja.

Entonces, se podría decir que hay UGC en algún lugar de estos X dominios propiedad de business Y, porque la política de privacidad lo dice, pero no hay una política que dicte que determinar que UGC solo está en el dominio A y no en B.

Los propios dominios representan límites de confianza con los navegadores, y para aquellos dominios que participan, existe un análisis posible para determinar qué recursos adicionales se consideran dentro del círculo de confianza establecido por el dominio. Así, por ejemplo, muchos dominios "confían" en jquery u otros sitios de alojamiento de javascript de terceros, lo que significa que estos sitios se convierten en objetivos de secuestro para distribuir malware o phish. Pero esto en sí no se corresponde con la presencia o ausencia de contenido generado por el usuario.

Muchos sitios, por supuesto, trafican en anuncios, que son un vehículo importante de phishing y entrega de malware. Incluso se puede rastrear exhaustivamente un sitio para determinar si sirve anuncios, pero si determina que un bot está visitando, puede decidir no entregar etiquetas publicitarias a ese cliente en particular porque hacerlo tendrá un impacto en métricas importantes para la publicación de anuncios y los ingresos. .

Los sitios de phishing se pueden ocultar detrás de las capas de acortadores de URL, y estos también pueden tomar decisiones en tiempo real sobre qué enlace entregar a qué visitante, por lo que incluso la presencia de enlaces en UGC no es necesariamente un indicador sencillo.

Finalmente, en el contexto de la popularidad, google.com ABSOLUTAMENTE puede alojar contenido de phishing, ya que el contenido generado por el usuario se devuelve en los resultados de búsqueda publicados bajo el dominio google.com.

    
respondido por el Jonah Benton 17.09.2016 - 17:19
fuente

Lea otras preguntas en las etiquetas