El principal problema con la protección de contraseña de un archivo PDF con una contraseña es que está basando la seguridad en una contraseña , que es una parte de los datos que un usuario humano, en algún lugar, encontró en su mente, y era lo suficientemente arrogante como para considerarlo "indiscutible". Resulta que la mayoría de las contraseñas son adivinables. La situación puede mejorarse de alguna manera haciendo que la transformación de contraseña a clave sea costosa (esto se denomina hashing de contraseña ) pero una contraseña débil aún es débil.
Un segundo problema es que no hay un formato uno para el cifrado de PDF, sino varios. El cifrado de PDF tiene una larga historia de esquemas personalizados, el primero de los cuales se arraigó en momentos en que los EE. UU. Tenían reglas de exportación estrictas y estrictas para el software con capacidad de cifrado; para hacer la historia corta, para permitir que el software sea exportado sin ninguna molestia administrativa, el cripto tenía que ser ridículamente débil. De ahí el formato de encriptación descrito por @begueradj en su respuesta: la contraseña está oculta, y solo los primeros 40 bits de los resultados se mantienen como "clave maestra" para todo el archivo. Una clave de 40 bits es altamente susceptible de búsqueda exhaustiva en las computadoras de hoy, haciendo que todo el encriptado sea una broma. Es ahora posible crear archivos PDF fuertemente encriptados, que las versiones modernas de Adobe Reader pueden procesar (personalmente escribí un código para hacer archivos PDF que podrían ser descifrados solo con una tarjeta inteligente), pero Hay que hacerlo explícitamente.
La estructura interna de PDF complica la situación. Un PDF es un conjunto de "objetos", algunos de ellos son flujos de otros objetos o datos sin procesar. La idea general es que el documento debe estar sujeto a una variedad de accesos, por ejemplo, saltar a cualquier página dentro del documento (posiblemente antes de haberlo descargado en su totalidad), o extraer una tabla de contenido. Debido a que el cifrado se aplica en una base por secuencia, la conclusión habitual es que se puede obtener gran parte de la estructura del documento sin romper el cifrado (por ejemplo, número de páginas, longitud de cada párrafo, número, tamaño y posición de las imágenes ... ). Si se trata de un problema grave o no, depende del contexto, en particular, por qué desea cifrar. El verdadero problema aquí es que la decisión sobre qué cifrar y qué no cifrar la toma un software genérico que, por definición, no puede ser consciente del contexto.
En la práctica, el objetivo de proteger con contraseña un archivo PDF es no para que sea realmente inescrutable para el intruso; Es para documentar, de manera clara e inevitable, que el contenido del archivo es sensible y que el archivo debe manejarse con cuidado. Es el equivalente a un sello rojo "de alto secreto".