Un hash criptográficamente seguro no cifrado, en teoría no debería proporcionar ninguna sugerencia sobre el contenido del mensaje, siempre que el mensaje sea único. Pero cuando un intruso sospecha que el mensaje es uno de un número finito de mensajes conocidos, puede comparar el hash con los hashes de estos mensajes conocidos y descubrir que es uno de ellos.
Ejemplo: Supongamos que obtendría una copia ilegal de una película con derechos de autor, y ahora me gustaría redistribuirla. El propietario de los derechos de autor me está sospechando de la piratería de películas y, por lo tanto, está espiando nuestra conexión. Están al tanto de todas las copias ilegales que circulan en Internet y se obtuvieron para calcular sus hashes.
Cuando uso su esquema de cifrado, pueden ver los hashs de los archivos que envío y compararlos con los hashes de los archivos de los que tienen copias. Cuando descubren que uno de mis mensajes coincide con uno de sus hashes, han demostrado con una certeza extremadamente alta que distribuí su contenido protegido por derechos de autor, incluso sin tener que descifrar el cifrado.
Agregar una sal no ayuda mucho, porque cuando la sal no está encriptada, pueden volver a calcular los hashes de sus archivos con la sal de cada mensaje.
Agregar datos sin sentido para "enturbiar el agua" antes de que el hash no agregue ninguna seguridad, porque solo es seguridad por oscuridad. No pasará mucho tiempo para que un criptoanalista se dé cuenta de que se pueden ignorar los datos.
Conclusión: Cifre mejor el hash junto con el contenido.