¿Es posible usar la fuente para descifrar visualmente el texto cifrado [cerrado]

2

El objetivo es evitar que los rastreadores web copien fácilmente los artículos.

  1. Cifra el texto con un código de sustitución.
  2. Genere una fuente que contrarreste la sustitución y transfiera a la interfaz web. (Esto funciona haciendo que los caracteres de texto se representen como su sustituto en lugar de su carácter real).
  3. Cuando el navegador procesa texto con esta fuente, el usuario puede leer el texto real directamente.
  4. Los usuarios leen como de costumbre. Los rastreadores ven galimatías. Objetivo alcanzado.
pregunta Donald Wu 05.09.2017 - 08:23
fuente

3 respuestas

2

No está del todo claro cómo lo imaginas exactamente. Pero dada la descripción hasta ahora, asumo que simplemente asigna, por ejemplo, el carácter "Z" a algo con forma de "A" y luego reemplaza cada A en su página con Z, que se mostrará como A en la pantalla debido a la fuente especial.

Además de ser una pesadilla para cualquier usuario que confíe en la lectura de la pantalla, probablemente sea fácil de descifrar: por ejemplo, uno podría usar OCR para encontrar el texto real, comparar esto con el código fuente HTML y, por lo tanto, construir una asignación entre el código fuente. Personaje y personaje mostrado. Incluso esto podría no ser necesario porque uno podría hacer un análisis estadístico del código fuente HTML y otra comparación de nuevo en un diccionario para obtener el mapeo entre el carácter del código fuente y el carácter visualizado porque esto es esencialmente solo un cifrado por sustitución basado en letras individuales.

  

Esta fuente se crea con algunas teclas de One Time Pad.

No estoy seguro de lo que realmente quieres decir con esto. Pero podría significar que cada asignación entre el carácter en el código fuente y el carácter mostrado se realiza solo una vez en lugar de reutilizar la misma asignación todo el tiempo como lo he descrito anteriormente. Si bien no tiene un cifrado de sustitución fácil de descifrar de esta manera, significa que necesitaría muchas fuentes para cada página HTML. Esto sería aún más una pesadilla de usabilidad que con una sola fuente. Pero, OCR todavía podría ser utilizado para extraer el texto. Esencialmente, la protección es más o menos igual que si solo hicieras una foto de la página y la pusieras en línea.

Por lo tanto, esencialmente: hace que sea un poco más difícil para los rastreadores web, pero también lo es para los usuarios finales.

    
respondido por el Steffen Ullrich 05.09.2017 - 08:53
fuente
0

Respuesta actualizada:

Su pregunta es mucho más clara ahora que la reformuló. Está describiendo un cifrado de sustitución monoalfabético : cada letra está codificada por otro punto de código que con el ASCII clásico o el UTF-8. codificación (asumiendo texto en inglés).

Esto hará que el bot común no pueda analizar correctamente el contenido textual de las páginas web. Sin embargo, este cifrado es fácilmente roto por análisis estadístico o por conocer una parte del texto. Por lo tanto, sería relativamente fácil escribir un bot (o mejorar un rastreador web) para descifrar automáticamente la mayoría de sus páginas web.

Respuesta original:

Responderé tu pregunta punto por punto.

  

¿Es posible cifrar texto con una fuente de diseño sofisticado?

No. Porque así no es como funciona el cifrado. Lo que estás pidiendo es simplemente imposible.

  

El objetivo es evitar que los rastreadores web copien fácilmente los artículos.

Los rastreadores web no se preocupan por la fuente que está eligiendo. No tienen ojos.

  

A pesar de que la fuente se puede descompilar, ¿es práctico cifrar texto con una fuente de diseño sofisticado? (Se proporcionan fuente y texto cifrado)

Puede ofuscar o codificar un texto renderizado con una fuente especial, pero eso no es un cifrado. A lo sumo es un cifrado de sustitución, que no ofrece ninguna seguridad real. Además, el texto cifrado es la salida de un algoritmo de cifrado, no su entrada. Si ya tiene un texto cifrado, ¿por qué desea cifrarlo nuevamente?

  

Esta fuente se crea con algunas teclas de One Time Pad.

Una vez el pad no es un protocolo de cifrado, es un algoritmo de cifrado poco práctico. Además, en cualquier mecanismo de cifrado, debe proporcionar la clave de descifrado a las que descifran el mensaje. ¿Cómo planea entregar esta clave solo a los lectores previstos y no a los rastreadores web?

Para resumir, no creo que entiendas lo que estás preguntando. Te sugiero que leas sobre:

  • cómo se codifica una página (HTML),
  • ¿Qué es una fuente,
  • ¿Qué es el cifrado?

Para el último punto, te sugiero que leas sobre la máquina Enigma, porque puedes encontrar muchos artículos y libros muy bien escritos que te explicarán los fundamentos del cifrado.

    
respondido por el A. Hersean 05.09.2017 - 09:27
fuente
0

Describir esto como "encriptación" es una gran complicación y me gustaría cuestionar el valor de hacer algo más complicado que una putrefacción 13. Lo sugiero porque es poco probable que un rastreador se moleste en intentar contrarrestar su enfoque particular a menos que tenga contenido Eso atraería directamente la atención especializada. Por lo tanto, el uso de ROT13 debería ser tan eficaz como la tarea mucho más difícil de agregar una capa de procesamiento y generar dinámicamente una fuente que se debe cargar para ver la página.

La idea de un pad de una vez también es irrelevante ya que, por definición, una OTP no puede repetir un cambio, pero su fuente se utilizará para todo el texto. Esto significa que se formará un patrón fácilmente analizable. Supongo que podría renderizar diferentes fuentes para cada carácter de repetición, pero eso requerirá un gran uso de datos y un procesamiento intensivo para generar todas esas fuentes sobre la marcha sin un valor práctico. (En particular, dado que el procesamiento y la OCR proporcionan una contramedida perfectamente efectiva para un adversario determinado o sofisticado).

No proporcionará ninguna seguridad más allá de la protección contra la legibilidad de la máquina, pero debe resaltarse, esto tiene costos de accesibilidad severos, así como cualquier lector de pantalla (lo que las personas ciegas usan para usar una computadora) depende de que el contenido sea legible por máquina para función. Estaría bloqueando el acceso de cualquier usuario que dependa de un lector de pantalla a su sitio. Es posible que pueda evitarlo al permitir que los usuarios registrados utilicen una fuente no codificada para que sea legible por la máquina y tomar precauciones para no permitir que los robots se registren.

Esto también podría ser útil como mecanismo antispam (registro de bot). Podría usarlo para disfrazar algunas de las entradas en el registro para que sea más difícil crear una respuesta válida sin intervención manual. Esto podría ser víctima de los mismos problemas de accesibilidad, pero podría proporcionar alguna ruta de registro alternativa (como la aprobación manual) para alguien que necesite asistencia con el lector de pantalla.

    
respondido por el AJ Henderson 05.09.2017 - 15:46
fuente

Lea otras preguntas en las etiquetas