Spider utilizando Python-urllib

-1

Me he dado cuenta de que una IP (35.188.27.83) intentó acceder a varias páginas confidenciales en mi sitio web (phpmyadmin, wp, sqllite, etc.) y recibió una gran cantidad de errores 404. Después de realizar una investigación sobre la PI :

  ISP   Google Inc.
    Usage Type  Search Engine Spider
    Domain Name google.com

También al hacer un nslookup:

   Name:    83.27.188.35.bc.googleusercontent.com
   Address:  35.188.27.83

También había una entrada interesante en el registro:

  

Python-urllib / 2.7 - -

¿Se sabe que Google está utilizando urllib-python para acceder a directorios y URL confidenciales? Si no es así, ¿cómo probar que se trata de un robot falsificado que se utiliza con fines maliciosos?

    
pregunta Gabrielius 21.10.2017 - 22:22
fuente

1 respuesta

1

Como un punto genérico, se sabe que Google utiliza una gran cantidad de Python, (IIRC fue su herramienta de ir a la herramienta antes de cambiar un montón de cosas para ir) m, por lo que puede ser una araña de Google legítima que rastree su sitio. / p>

Dicho esto, suponiendo que tiene un archivo robots.txt configurado para limitar dicho rastreo, puede ponerse en contacto con Google para preguntar por qué se ignoró: enlace es probablemente un buen punto de partida.

Si no tiene un archivo robots.txt configurado, o está configurado incorrectamente, debe corregirlo y esperar a ver si hay una repetición.

Si resulta que no fue una araña legítima de Google, es probable que tengan muchos más recursos que la mayoría de nosotros para resolver el problema.

Nota: no soy empleado de Google ni de AFAIK, y nunca he sido empleado de ninguno de sus afiliados, por lo que se basa únicamente en información disponible públicamente.

    
respondido por el Steve Barnes 22.10.2017 - 08:55
fuente

Lea otras preguntas en las etiquetas