¿Puedo redactar convirtiendo PDF a TIFF y viceversa?

5

Fondo

Mi jefe me pidió que propusiera una manera en que los usuarios normales puedan redactar información de archivos PDF utilizando software libre. Obtenemos una gran cantidad de documentos escaneados y nuestro cliente requiere que la información confidencial se elimine de los PDF antes de que se carguen en su sistema. Esto es lo que se me ocurrió. Me he convencido a mí mismo de que esto destruirá de manera efectiva los metadatos del cliente potencialmente sensibles del documento original, además de hacer imposible eliminar cualquier barra negra que cubra información sensible. Sin embargo, también he descubierto que no sé casi tanto como creo.

Muchos miembros del foro que publican sobre este tema han declarado con bastante firmeza que solo Adobe Acrobat u otro software de pago pueden hacerlo de forma segura. Si usted es de esta opinión, por favor explique por qué. Tengo problemas para averiguar por qué esto no funcionaría.

Descripción general

En algún programa PDF, cubra las cosas sensibles con cuadros, luego conviértalos a un archivo TIFF. Luego, vuelva a convertir el archivo TIFF en un PDF.

  • ¿Esto funcionaría? ¿El archivo TIFF conserva información sobre objetos o capas? ¿Hay algún metadato potencialmente sensible que pueda pasar, o se cambiarán todos los metadatos, como espero?

Cómo lo hago específicamente

No sé si debería incluir esto, ya que la pregunta general probablemente será más útil, pero aquí está mi configuración específica:

El software:

PDFCreator y Foxit PDF.

La configuración:

Cambie la configuración en PDFCreator para que convierta el documento a un TIFF, en lugar de un PDF. Para la salida, configure PDFCreator para que se imprima de nuevo en FoxIt, en lugar de abrir el documento.

El proceso:

  1. Abra el PDF en Foxit Reader y cubra los datos sensibles visibles con rectángulos negros.
  2. Imprima el documento en PDFCreator.
  3. En el fondo, PDFCreator guarda el archivo como TIFF y luego imprime el TIFF en la impresora de PDF de Foxit. Foxit le pregunta dónde desea guardar el PDF.

Relacionado

Inspirado por Deshacer una parte de un PDF o la redacción del texto en AskDifferent.

Esto está relacionado con ¿Cómo eliminar datos meta y confidenciales del archivo PDF? , pero todos estamos en Windows, no Unix.

También relacionado con el Superusuario: ¿Cómo eliminar OCR de un PDF?

Instrucciones paso a paso para un proceso similar por otra persona: Redacción rápida y sucia

Resumen

Desde un punto de vista de seguridad, ¿será suficiente la conversión de un PDF a una imagen, el bloqueo de una parte y luego la conversión de nuevo a un PDF para eliminar información del documento?

    
pregunta browly 15.09.2015 - 23:04
fuente

1 respuesta

1

Si los documentos escaneados no han pasado un proceso de OCR y aparecen sin metadatos confidenciales, se procesan en TIFF, se cambian correctamente los píxeles que se van a redactar a un negro uniforme (o cualquier otro color), se aplana el TIFF y escribirlo como PDF sería suficiente. Esto se debe a que creas un documento completamente nuevo. Si tuviera metadatos, esos metadatos se referirían a su proceso, y no a los anteriores.

Dependiendo de los requisitos para el documento redactado, puede ejecutar OCR sobre él y / o agregar sus metadatos personalizados. Pero, nuevamente, eso se haría bajo su control.

Lo ideal es que los escaneos lleguen como TIFF, que usted procesa, y solo luego crea el PDF. Esto simplificaría el flujo de trabajo.

En cualquier caso, necesitarías un editor de imágenes que entienda TIFF y PDF, y hacer la redacción en el editor de imágenes.

    
respondido por el Max Wyss 16.09.2015 - 17:41
fuente

Lea otras preguntas en las etiquetas