He reflejado un sitio de comercio electrónico usando wget. Este sitio parece utilizar Cloudflare para manejar su tráfico web.
Lo que es interesante es que después de que se realizó aproximadamente el 90% de la duplicación, wget comenzó a producir / recibir muchos mensajes de error. Luego traté de abrir el sitio en un navegador normal, pero recibí un error 403 y un mensaje de Cloudflare "La solicitud fue bloqueada". Ok, bastante bien, probablemente no quieren que la gente descargue 1.5 millones de páginas de ellos (que es lo que yo había hecho en ese momento).
Sin embargo
- Cuando uso el navegador Tor en la misma máquina en la que ejecuto wget para acceder al mismo sitio, aparece el mismo mensaje de error.
- Cuando accedo al mismo sitio usando mi segunda computadora (ambas máquinas están conectadas al mismo WiFi) tanto en un navegador normal como en el navegador Tor, funciona bien.
¿Cloudflare ha logrado, de alguna manera, hacer una huella dactilar de la máquina en la que ejecuto wget de manera que les permita identificar también mi máquina a través de Tor? ¿Cuánta información revela wget cuando se conecta a un servidor web?
Ese hardware es un Macbook Pro 15 bastante común ", por lo que no hay nada extraordinario allí.
El navegador Tor se está ejecutando con su configuración predeterminada.