Browser - lo que se guarda en el disco

1

Ejecutamos trabajos de raspado en nombre de los usuarios. Usamos webkit-gtk como navegador para hacer el raspado. Cada trabajo se ejecuta como un proceso separado

Para no mezclar los datos del usuario, hemos aislado los siguientes datos por usuario.

  1. Cookies
  2. cookies flash
  3. archivos de caché
  4. almacenamiento HTML 5

¿Debo preocuparme por otros tipos de archivos que la sesión normal del navegador guardará? El "navegador" no tiene otros complementos aparte de flash. El navegador no guarda ninguna contraseña y el llenado automático del formulario está deshabilitado.

    
pregunta user871199 22.07.2014 - 04:13
fuente

1 respuesta

1

Parece que tienes cubiertos los datos básicos del usuario, pero no estoy seguro de por qué tratar de aislarlos así. Ejecutaría las instancias del navegador de cada usuario con un área de almacenamiento / directorio de inicio en la memoria. Luego, cuando el proceso termina, todos los datos se destruyen, sin riesgo de dejar nada atrás. Webkit sin cabeza como PhantomJS proporciona indicadores específicamente para mover estos datos a sus propios directorios, que se pueden colocar en un disco RAM de tmpfs. (Webkit-gtk parece ser una biblioteca, ¿así que supongo que lo ha incluido en su propio programa?)

    
respondido por el David 22.07.2014 - 04:44
fuente

Lea otras preguntas en las etiquetas