¿De qué manera puede un sitio web detectar mi dirección IP original, aunque esté usando un servidor proxy? He notado esto con algunos sitios. Hay cuatro métodos proxy que he usado:
- Firefox con una configuración de proxy.
- Python con
mechanize.set_proxies
. - Firefox en una máquina virtual con un enrutador de máquina virtual de modo que toda la máquina virtual de Internet pase por un proxy.
- TorBrowser (que utiliza Firefox como el navegador real).
Las siguientes cosas son comportamientos que he notado que se esperan:
- Con todos estos, si voy a
http://www.whatismyip.com/
, da la dirección IP correcta (la dirección IP del proxy, no la computadora host). -
whatismyip.com
dice "No se detectó proxy" para todos estos.
De hecho, parece que los sitios web que visito piensan que mi IP es la del proxy. Sin embargo, ha habido algunos casos extraños que me hacen pensar que algunos sitios pueden detectar de alguna manera mi dirección IP original. Tengo curiosidad por cómo hacen eso.
- En una situación, al visitar un sitio no estadounidense a través de Firefox con un proxy no estadounidense, el sitio literalmente pudo imprimir mi dirección IP de origen (desde EE. UU.) y negarme el acceso. ¿No debería esto ser imposible? Sin embargo, el sitio no pudo hacerlo al visitar el sitio a través de la máquina virtual con ese mismo proxy no estadounidense o el TorBrowser con un nodo de salida no estadounidense.
- En una situación similar, estaba visitando otro sitio no estadounidense desde un proxy no estadounidense. Si inicié sesión en el sitio desde Firefox dentro de la máquina virtual o desde TorBrowser con un nodo de salida que no sea de los EE. UU., El sitio funcionaría correctamente. Sin embargo, si intentara iniciar sesión a través de Firefox con un proxy (el mismo proxy que usa la máquina virtual), o con
mechanize
, no podría iniciar sesión con un mensaje de error no relacionado. - En una tercera situación, al usar la opción
mechanize.set_proxies
, sobrecargué un sitio con demasiadas solicitudes, por lo que decidió bloquear el acceso (se desactivaría a propósito cada vez que inicie sesión). Pensé que podría haber bloqueado la dirección IP del proxy. Sin embargo, cuando ejecuté el código desde una máquina host diferente, pero con el mismo proxy, funcionó de nuevo, por un corto tiempo, hasta que lo volvieron a bloquear. (No se preocupe, no volveré a acosar el sitio; seguí ejecutando el programa porque pensé que podría haber sido un problema técnico, no a un bloque de su final). Visitar ese sitio con la solución Firefox + proxy de uno de los hosts bloqueados también resultó en un tiempo de espera útil.
Me parece que todos estos sitios, en los casos de proxy de Firefox + y mechanize
, pudieron averiguar algo sobre la dirección IP de la máquina host, mientras que en los casos de TorBrowser y de máquinas virtuales no estaban . Mi pregunta es esencialmente: ¿Cómo pueden los sitios recopilar esta información? Otra forma de preguntar es: ¿en qué se diferencian los casos de TorBrowser y las máquinas virtuales que impiden que los sitios recopilen esta información?