El FBI actualmente imprime y redacta documentos usando mecanismos analógicos. Tengo curiosidad por saber si alguien ha investigado la exactitud de inferir las posibles palabras o nombres. Ciertamente, dado el ancho estático de los caracteres en el conjunto de fuentes de ancho variable, el espacio limitado disponible y la probabilidad de secuencias de caracteres, esto debería ser factible.
- Creo que este era el documento original
- Creo que este documento se ha alineado para los propósitos de la OCR
Aquí hay un fragmento del documento tomado de la página 61.
Lecturasdefragmentos,
(U//LES)Anidentified'<REDACTED>'asofOctoberplannedtoengageinsniperattacksagainstprotestorsinHouston,Texas,ifdeemednecessary.Anidentified'<REDACTED>'hadreceivedintelligencethatindicatedtheprotestersinNewYorkandSeattleplannedsimilarprotestsinHouston,Dallas,SanAntonio,andAustin,Texas.'<REDACTED>'plannedtogatherintelligenceagainsttheleadersoftheprotestgroupsandobtainphotographs,thenformulateaplantokilltheleadershipviasuppressedsniperrifles.(Note:protestscontinuedthroughouttheweekendwithapproximately6000personsinNYC."Occupy Wall Street" protests have spread to about half of all states in the US, over a
dozen European and Asian cities, including protests in Cleveland 10/6-8/11 at Willard Park which was
initially attended by hundreds of protestors).
Ese pequeño fragmento cubre los caracteres latinos,
"(),-./0168:<>ACDEHLNOPRSTUWYabcdefghiklmnoprstuvwxyze
Estoy seguro de que los demás también se pueden extraer del documento.
Tomé las últimas líneas (que no tienen redacción) y las superpuse con una copia del mismo texto en Times New Roman . Estoy convencido de que la fuente es Times New Roman, pero que el escaneo es malo o que se hizo algo para ocultar la alineación.
Todaestavulnerabilidadestábasadaengrafemasdeanchovariable.Dondemuchaspalabraspuedenserdescalificadasporfaltadecoherenciayotrasporsutamañodecarácterconstituyente.Conlasfuentesdeanchovariable,cadagrafematienesupropiafirmadetamañoysibienhaycolisiones,creoquepuedenhacermuchoparacompletarlosespaciosenblanco.Aquíhaydospalabrasdesieteletras,porejemplo,podemosverqueunadeellasessustancialmentemásgrande:
Sin embargo, mirando advance para Times New Romano, no estoy seguro de cuán útil sería esto.
"512" : "."
"569" : "ijlt"
"682" : "-frI"
"797" : "sJ"
"909" : "acez"
"1024" : "bdghknopquvxy0123456789"
"1139" : "FPS"
"1251" : "ELTZ"
"1366" : "BCR"
"1479" : "wADGHKNOQUVXY"
"1593" : "m"
"1821" : "M"
"1933" : "W"
Podemos ver que en la clase de caracteres [A-Za-z0-9.-]
hay 13 longitudes diferentes posibles.