Ya que no hay absolutamente ninguna manera de saber qué hay dentro de ese archivo y de qué es capaz, te recomiendo que recortes tus pérdidas y las mates desde el principio. Con la mayoría de los PDF (y, de hecho, cualquier archivo realmente) puede recuperarlo relativamente rápido ya que el PDF está destinado a residir en otro lugar (ya sea un borrador anterior o una versión sin modificar).
Dicho esto, parece muy interesado en abrir este PDF, así que supongo que tiene algún tipo de singularidad. Necesitará perdonarme por ponerme el sombrero del trabajo diario, pero generalmente esto significa que un usuario no ha guardado o hecho una copia de seguridad de sus documentos cuando debería. Si ese no es el caso, y este es realmente el Rollo del Mar Muerto del mundo de los PDF, veamos cómo podemos abrir / limpiar estos archivos sin dañarlos o, de hecho, a usted mismo.
Usando un navegador para recuperar el PDF
Has abierto abriéndolos en un navegador varias veces:
"Suba el documento a Google Docs. Supongo que Google tiene uno de los visores de PDF más seguros".
y
"Use pdf.js de Firefox o algún otro visor basado en navegador"
Como dije al principio, no tenemos idea de con qué estamos tratando en este momento. Abrirlo en un navegador (en esta etapa) no sería recomendable. También subirlo a Google es un poco poco ético, ya que usted sabe muy bien que hay algo sospechoso en el PDF.
Incluso si de alguna manera pudieras saber exactamente de qué es capaz el contenido malicioso de ese archivo PDF, no hay forma de asegurarte de que no haya sido manipulado para ocultarlo.
Usando una máquina virtual / aislada para recuperar el PDF
Lo mencionaste en el parte central de tu pregunta , usar una máquina virtual o una máquina aislada es obviamente una forma mucho más segura. de abrir ese PDF.
Puede que piense que es mucho tiempo para configurar uno de ellos, pero si mantiene una instantánea de los sistemas pequeños, limpios y portátiles que se toman inmediatamente después de que se complete la instalación, podemos abrir el PDF de forma casi segura, imprimir los contenidos a archivar (como @KnightOfNi ya ha aludido) sin las capacidades de edición de PDF. ¿Por qué no ir un paso más allá e imprimirlos en un bucle cerrado con una impresora USB y volver a escanearlos? Puede parecer una molestia masiva pero estamos lidiando con una bomba de tiempo de magnitud desconocida. Podría destruir su sistema, robar sus datos, crypto-locker sus cosas, o simplemente ser un limón, el punto es que no tenemos idea.
"¿Puedo estar seguro de que es seguro?"
De tu pregunta:
Otra pregunta que tengo: ¿Qué tan confiable es la herramienta pdfid? Por ejemplo, si obtengo un resultado sin Javascript, OpenAction, etc. ¿puedo estar seguro de que es seguro?
Una vez más, no realmente, pero hay formas en que puede realizar una prueba para ver qué tan precisa es la herramienta.
- Si es de código abierto, investigue el código y asegúrese de que no está escupiendo basura y apenas toca los archivos.
- En ese laboratorio de máquina virtual / aislado, ¿por qué no lanzar algunos archivos buenos / malos / feos que se sabe que están infectados con una cierta variedad de malware? Puede hacer su propio rollo o puede comunicarse con la comunidad de investigadores, que generalmente tiene algunos ejemplos para descargar en línea.
Para ser honesto, todo depende de cuánto quieras recuperar ese PDF. Para la mayoría de las personas, es mucho más complicado de lo que vale ... pero, de nuevo, eso depende de los contenidos.
Lo que haría:
- Máquina virtual aislada en una máquina física aislada (suena como una exageración, pero así es como probé la primera experiencia de mi con CryptoLocker, me alegro de haberlo hecho de esa manera).
- Eso significa que no se comparten archivos (es decir, compartir el escritorio - > escritorio en la VM)
- Ir para un sistema operativo extraño. Cuanto más extraño mejor. La mayoría de estos virus PDF están dirigidos a usuarios específicos de versiones específicas de un sistema operativo. Dudo que hayan pensado en Kali, TAILS o similar
- Desactivar complementos / eliminar áreas o aplicaciones conocidas de interés (flash, etc.)
- Abra un PDF de prueba y configure todas las configuraciones de seguridad al máximo antes de abrir el documento de destino
- Abra el documento de destino, imprímalo físicamente, vuelva a escanearlo.