robots.txt y riesgo asociado [cerrado]

-1

robots.txt es un archivo que contiene una ruta que bot no puede rastrear la mayoría de las veces bots de motores de búsqueda como el bot de Google, etc. Le dice al motor de búsqueda que este directorio es privado y no puede ser rastreado por ellos.

Aquí está el archivo robots.txt de un sitio. enlace :

User-Agent: *
Disallow: 
Allow: /

Lo que simplemente obtengo por enlace .

¿Existe algún riesgo al usar el mismo?

En segundo lugar, si intento buscar dentro del sitio web utilizando Google al ingresar la palabra clave site:sppp.rajasthan.gov.in solo obtengo pocos resultados. Entonces, si robots.txt de este sitio en particular no tiene ninguna restricción, ¿por qué todas las páginas del sitio no están indexadas y se muestran en los resultados de Google?

    
pregunta Sudarshan Taparia 18.09.2015 - 13:09
fuente

1 respuesta

1

Aunque no tiene sentido lo que está escrito en este robots.txt específico, no veo un riesgo de seguridad al tener un robots.txt en general.

La aplicación web / sitio web debe ser lo suficientemente seguro, incluso si robots.txt revela directorios confidenciales, ya que la seguridad por oscuridad debe evitarse en todo momento.

En otras palabras, incluso si yo, como atacante, conozco todas las ubicaciones confidenciales, no debería poder descargar ni ver ninguna información confidencial.

    
respondido por el Jeroen - IT Nerdbox 18.09.2015 - 13:36
fuente

Lea otras preguntas en las etiquetas