Cómo redactar HTML para que no termine en PDF

1

Estoy tratando de crear una versión impresa e imprimible de una página web. Me gustaría que el usuario tenga la opción de convertir esta página fácil de imprimir en un PDF y enviarla por correo electrónico a otra persona.

Mi investigación indica que la mejor manera de redactar datos de cualquier tipo de documento electrónico es eliminarlo. En mi caso esto no es posible.

A continuación, he visto varias publicaciones que sugieren el uso de CSS para mostrar el texto como cuadrados negros, etc. Estoy pensando en usar visualización: ninguna para que el texto simplemente no se represente.

Finalmente a mis preguntas: si utilizo CSS para ocultar el texto redactado de alguna manera, ¿este texto aún se incluirá en el PDF y podría un Usuario de Adobe con conocimientos acceder a esos datos? ¿O hay otro método que debería probar?

    
pregunta ann b 12.07.2016 - 18:34
fuente

3 respuestas

3

Puede usar un analizador de HTML como BeautifulSoup para eliminar mediante programación las etiquetas HTML o reemplazarlas por etiquetas como <div class=redacted>~~~~~~~~~~</div> y agregar una clase redactada a su hoja de estilo con texto negro y fondo negro, o simplemente poner display:none . Nota: reemplace la información redactada con datos no deseados: ¡esta es la clave!

Editar: usando pantalla: ninguna no funcionará porque un usuario solo puede mirar el HTML sin procesar. Simplemente reemplácelo con caracteres no deseados y estilícelos según sus necesidades.

    
respondido por el noɥʇʎԀʎzɐɹƆ 12.07.2016 - 19:03
fuente
2

Es posible que su servidor sirva una versión del HTML con el contenido redactado eliminado.

Parece que tiene alguna funcionalidad del lado del servidor disponible para realizar las funciones de correo electrónico y PDF. Servir HTML alternativo (donde el contenido redactado se elimina completamente del HTML) puede no ser una adición significativa a su aplicación en comparación con lo que ya está haciendo.

Sin embargo, si esto no es posible, y está limitado a las reglas CSS, La ruta más segura para usted es convertir la página en una imagen después de la redacción, e incluir solo la imagen en el PDF generado. (desafortunadamente, también pierdes las funciones de selección de texto haciendo esto)

Si necesita mantener el formato del texto y no convertirlo a una imagen, usar display:none suena como el enfoque más probable que podría funcionar. Sin embargo, todo depende del generador de PDF que esté utilizando. Es probable que algunos generadores de PDF sigan incluyendo el contenido en forma oculta (o visible).

También puede considerar el uso de JavaScript para eliminar el elemento redactado, pero muchos generadores de PDF no lo admiten.

Un último punto, las técnicas de CSS y JavaScript no eliminarán el contenido redactado del HTML, por lo que si está permitiendo que la gente envíe una versión HTML por correo electrónico, el contenido redactado seguirá allí. Sin embargo, parece que solo está interesado en enviar por correo electrónico copias en PDF ...

    
respondido por el George Bailey 12.07.2016 - 19:02
fuente
0

La ÚNICA manera de redactar contenido digital es eliminarlo. Puede ocultarlo de muchas maneras, y ninguna de ellas será efectiva.

    
respondido por el Nstr10 12.07.2016 - 18:55
fuente

Lea otras preguntas en las etiquetas