La investigación para comprender, documentar y proteger mejor contra el phishing es, por supuesto, deseable, pero me gustaría repetir la respuesta anterior de que a nivel de dominio esto es probablemente imposible sin hacer un análisis de contenido, ya que equivale a para probar una información negativa y completa para la que no existe.
La presencia o ausencia de contenido generado por el usuario en el contenido entregado por una empresa conlleva disposiciones adicionales en una política de privacidad, específicamente para citar leyes que protegen a las empresas contra demandas basadas en contenido creado por usuarios que no representa la política de la empresa. .
Probablemente es posible analizar un conjunto de políticas de privacidad y determinar cuáles sugieren la presencia de contenido generado por el usuario, pero que se asigna solo a las empresas, no a los dominios.
Generar la lista completa de dominios y subdominios en posesión de una empresa es un arte, ya que esa información no es expresamente pública y debe ser adivinada o deducida. En el contexto de un dominio específico, una política dada puede aplicarse a muchos dominios en posesión de la empresa que en última instancia es responsable de la política, y no necesariamente se aplica específicamente al dominio bajo el cual se aloja.
Entonces, se podría decir que hay UGC en algún lugar de estos X dominios propiedad de business Y, porque la política de privacidad lo dice, pero no hay una política que dicte que determinar que UGC solo está en el dominio A y no en B.
Los propios dominios representan límites de confianza con los navegadores, y para aquellos dominios que participan, existe un análisis posible para determinar qué recursos adicionales se consideran dentro del círculo de confianza establecido por el dominio. Así, por ejemplo, muchos dominios "confían" en jquery u otros sitios de alojamiento de javascript de terceros, lo que significa que estos sitios se convierten en objetivos de secuestro para distribuir malware o phish. Pero esto en sí no se corresponde con la presencia o ausencia de contenido generado por el usuario.
Muchos sitios, por supuesto, trafican en anuncios, que son un vehículo importante de phishing y entrega de malware. Incluso se puede rastrear exhaustivamente un sitio para determinar si sirve anuncios, pero si determina que un bot está visitando, puede decidir no entregar etiquetas publicitarias a ese cliente en particular porque hacerlo tendrá un impacto en métricas importantes para la publicación de anuncios y los ingresos. .
Los sitios de phishing se pueden ocultar detrás de las capas de acortadores de URL, y estos también pueden tomar decisiones en tiempo real sobre qué enlace entregar a qué visitante, por lo que incluso la presencia de enlaces en UGC no es necesariamente un indicador sencillo.
Finalmente, en el contexto de la popularidad, google.com ABSOLUTAMENTE puede alojar contenido de phishing, ya que el contenido generado por el usuario se devuelve en los resultados de búsqueda publicados bajo el dominio google.com.