Identificación de documentos por hash: ¿cuáles son las implicaciones de seguridad?

1

Supongamos que estoy desarrollando un servicio (DocBot) para ayudar a la transferencia de archivos adjuntos de correo grandes. En lugar de adjuntar documentos a sus mensajes directamente, Alice agrega el hash de cada documento y lo envía por separado a DocBot, que solicita el documento completo si no reconoce el hash.

Cuando Bob recibe el mensaje, le pide a DocBot el documento original asociado con el hash. En aras de la discusión, DocBot no requiere ninguna información adicional de Bob - si alguien conoce el hash, esto se toma como prueba de que está autorizado para ver el documento original.

Mi pregunta es: suponiendo que el esquema hash sea lo suficientemente resistente a la colisión y la preimagen, y que nadie pueda interceptar los mensajes de Alice a Bob, ¿qué nuevas vulnerabilidades introduce este esquema? Es decir, ¿DocBot crea formas para que un usuario malintencionado obtenga información que no debería o interfiere con las comunicaciones de otras personas?

    
pregunta bobtato 07.12.2017 - 04:56
fuente

2 respuestas

2

DocBot permitiría a un usuario malintencionado obtener información (leer documentos) si DocBot no está diseñado para prevenir ataques de fuerza bruta.

Específicamente, si conocer el hash es toda la prueba que se necesita, iterar un flujo de hashes podría, en principio, renunciar a los documentos de Alice.

    
respondido por el count_zero 07.12.2017 - 10:09
fuente
1

La primera vulnerabilidad es que cualquier persona con un conjunto de documentos puede averiguar si esos documentos ya están en DocBot o no.

La segunda vulnerabilidad relacionada es que cualquier persona con una plantilla de un documento de formulario puede encontrar documentos de formulario similares con, esencialmente, una búsqueda de diccionario.

Por ejemplo, tengo o encuentro un ejemplo de un PDF de hipoteca válido:

Mortgage: Mr. Weakpasswords, 123 Anti Ln, $183,300.  blah, blah, blah.

Ahora, tomo ese PDF y simplemente cambio los campos de texto, buscando otros documentos usando algunas cosas que conozco y adivinando algunas que no, luego enviando el hash para ver si existe mi suposición, por ejemplo:

Mortgage: Mr. Bobtato, 987 DocBot St, $1.  blah, blah, blah.

No, ningún documento coincidente.

Mortgage: Mr. Bobtato, 987 DocBot St, $2.  blah, blah, blah.

No, ningún documento coincidente. Inténtalo de nuevo.

Mortgage: Mr. Bobtato, 987 DocBot St, $312,767.  blah, blah, blah.

¡Hah! ¡Ahora sé cuánto es tu hipoteca!

Oye, ¿qué pasa si tengo otro PDF?

Bank of WeakPasswords: Mr. Bobtato, your PIN has been changed.  Your PIN is now 1234.

Ves el problema.

Dependiendo del estado legal de DocBot y la compatibilidad de licencias, es posible que desee consultar Tahoe-LAFS sistema de archivos distribuido seguro; han tratado muchos de estos problemas con mucho mayor detalle de lo que su pregunta implica.

    
respondido por el Anti-weakpasswords 11.01.2018 - 06:52
fuente

Lea otras preguntas en las etiquetas