¿Cómo hacer que sea más difícil extraer datos de un sitio web?

2

Supongamos por un momento que dirijo un sitio web público que hospeda fotos y nombres de personas en forma de "cartelera" (es decir, no es necesario registrarse para ver la información) y que mi sitio sufre de "copia- los sitios "cat" copian mis imágenes y nombres y los publican como propios, a menudo pidiendo dinero y utilizando la información para aflojar las cadenas de sus lectores.

¿Hay alguna manera de hacer que sea más difícil para los "bots", "arañas" u otro software hecho a medida capturar automáticamente la información de la página?

¿Debo tomar alguna consideración para ayudar a minimizar el riesgo de robo (por falta de una palabra mejor), tanto para el robo automatizado (por ejemplo, basado en software) como para el robo manual (por ejemplo, copiar / pegar / capturar capturas de pantalla)? / p>

Aprecio que una vez que se pone algo en Internet, está ahí "para siempre", pero hasta ahora he pensado en las siguientes ideas y estoy buscando más (si las hay):

  • Agregar una marca de agua a las imágenes ayudaría a reducir la facilidad con la que los sitios copy-cat pueden pasar mis imágenes como propias (pero pueden tener un impacto en la efectividad de las imágenes, a menos que haya alguna manera para que pueda eliminar la marca de agua cuando la imagen se muestra en mi sitio)
  • Forzar a mis usuarios a iniciar sesión ayudaría a reducir la exposición de los datos a los robots (pero puede tener un impacto significativo en el número de espectadores y / o la efectividad de mi sitio)
pregunta oliver-clare 25.06.2012 - 15:57
fuente

1 respuesta

1

Tengo una solución simple para toda la información de tu texto. Utilice un texto - > Convertidor de imágenes para convertir nombres en texto. enlace hace esto simplemente mostrando los nombres de los individuos como imágenes que los bots no pueden copiar simplemente y luego establecen fuera de curso.

Otra solución es usar reCaptcha o un equivalente más seguro (considerando que ciertos bots avanzados también pueden descifrar eso incluso ahora). Fundamentalmente, obtenga una ventana emergente de vez en cuando para una cantidad particular de solicitudes enviadas desde un solo cliente. Para uso legítimo, apenas debería causar un inconveniente.

    
respondido por el Rohan Durve 25.06.2012 - 19:17
fuente

Lea otras preguntas en las etiquetas