¿Descomprimir redacciones analógicas en fuentes de ancho variable?

3

El FBI actualmente imprime y redacta documentos usando mecanismos analógicos. Tengo curiosidad por saber si alguien ha investigado la exactitud de inferir las posibles palabras o nombres. Ciertamente, dado el ancho estático de los caracteres en el conjunto de fuentes de ancho variable, el espacio limitado disponible y la probabilidad de secuencias de caracteres, esto debería ser factible.

Aquí hay un fragmento del documento tomado de la página 61.

Lecturasdefragmentos,

(U//LES)Anidentified'<REDACTED>'asofOctoberplannedtoengageinsniperattacksagainstprotestorsinHouston,Texas,ifdeemednecessary.Anidentified'<REDACTED>'hadreceivedintelligencethatindicatedtheprotestersinNewYorkandSeattleplannedsimilarprotestsinHouston,Dallas,SanAntonio,andAustin,Texas.'<REDACTED>'plannedtogatherintelligenceagainsttheleadersoftheprotestgroupsandobtainphotographs,thenformulateaplantokilltheleadershipviasuppressedsniperrifles.(Note:protestscontinuedthroughouttheweekendwithapproximately6000personsinNYC."Occupy Wall Street" protests have spread to about half of all states in the US, over a
dozen European and Asian cities, including protests in Cleveland 10/6-8/11 at Willard Park which was
initially attended by hundreds of protestors).

Ese pequeño fragmento cubre los caracteres latinos,

"(),-./0168:<>ACDEHLNOPRSTUWYabcdefghiklmnoprstuvwxyze

Estoy seguro de que los demás también se pueden extraer del documento.

Tomé las últimas líneas (que no tienen redacción) y las superpuse con una copia del mismo texto en Times New Roman . Estoy convencido de que la fuente es Times New Roman, pero que el escaneo es malo o que se hizo algo para ocultar la alineación.

Todaestavulnerabilidadestábasadaengrafemasdeanchovariable.Dondemuchaspalabraspuedenserdescalificadasporfaltadecoherenciayotrasporsutamañodecarácterconstituyente.Conlasfuentesdeanchovariable,cadagrafematienesupropiafirmadetamañoysibienhaycolisiones,creoquepuedenhacermuchoparacompletarlosespaciosenblanco.Aquíhaydospalabrasdesieteletras,porejemplo,podemosverqueunadeellasessustancialmentemásgrande:

Sin embargo, mirando advance para Times New Romano, no estoy seguro de cuán útil sería esto.

"512"  : "."
"569"  : "ijlt"
"682"  : "-frI"
"797"  : "sJ"
"909"  : "acez"
"1024" : "bdghknopquvxy0123456789"
"1139" : "FPS"
"1251" : "ELTZ"
"1366" : "BCR"
"1479" : "wADGHKNOQUVXY"
"1593" : "m"
"1821" : "M"
"1933" : "W"

Podemos ver que en la clase de caracteres [A-Za-z0-9.-] hay 13 longitudes diferentes posibles.

    
pregunta Evan Carroll 06.04.2014 - 22:36
fuente

1 respuesta

1

Simplemente hay demasiadas combinaciones posibles para que una redacción de tamaño razonable sea útil. Ciertamente, puede usar el análisis de espaciado para rechazar valores posibles, pero no es una forma práctica de generar valores candidatos (un avance de 4096, por ejemplo, podría ser cualquiera de 60 palabras; 299 palabras si permite un 10% de desalineación).

    
respondido por el Mark 07.04.2014 - 09:30
fuente

Lea otras preguntas en las etiquetas