Hay un programa escrito en Java llamado Anonymouth que ayuda con esto:
Anonymouth es una aplicación basada en Java que tiene como objetivo brindar a los usuarios las herramientas y los conocimientos necesarios para comenzar a anonimizar los documentos que han escrito. Lo hace activando las bibliotecas JStylo (una aplicación de detección de autor también desarrollada por PSAL) para detectar patrones estilométricos y determinar características (como longitud de palabras, bigramas, trigramas, etc.) que el usuario debe eliminar / agregar para ayudar a obsesionar su estilo y identidad.
Por sí solo, Anonymouth tiene un valor limitado. El anonimato de su análisis de escritura requiere una comprensión básica de la lingüística y la estilometría. La estilometría básica incluye el llamado análisis de 5 características, donde se analizan cinco características principales del estilo de escritura (parafraseado de Wikipedia):
características léxicas : el análisis del léxico, la elección del vocabulario del autor. Diferentes personas usan diferentes palabras a diferentes ritmos, lo que puede hacer que sean bastante únicas. Yo, por ejemplo, tiendo a usar mucho la palabra tender . Tendría que evitar eso si quisiera ocultar mi escritura. El uso de palabras simples, cortas y comunes puede reducir el potencial de esta función.
características sintácticas : el análisis del estilo de escritura y la estructura de las oraciones del autor, como: puntuación, uso de voz pasiva y complejidad de las oraciones. El uso de oraciones tan simples como sea posible con un estilo de escritura estándar puede ayudar a debilitar esta función.
características estructurales : el análisis de la organización del autor del trabajo. Estos incluyen la longitud del párrafo, el espaciado, la sangría, el uso de comas de Oxford, etc. Al igual que para hacer que la segunda característica sea menos útil, puede hacer que esta característica sea menos útil siguiendo los estilos de escritura estándar en lugar de usar uno que naturalmente evolucionó con usted. / p>
características específicas del contenido : el análisis del lenguaje que es contextualmente importante para el tema del trabajo escrito. Los ejemplos incluyen el uso de jerga o acrónimos que pueden ser shibboleths. P.ej. un conjunto de propietarios de botnets se puede dividir fácilmente en aquellos que dicen "C & C", "CnC" y "C2".
características idiosincrásicas : el análisis de errores y otros elementos no gramaticales que pueden ser exclusivos del autor. Esta es, con diferencia, una de las características más dañinas y ha llevado a que muchas personas se desanonicen por su estilo de escritura. Pequeños errores cometidos en una identidad no anónima pueden llevar a identidades anónimas, posiblemente vinculándolas.
Muchas de estas funciones se pueden anonimizar usando el inglés estándar con gramática y ortografía completamente adecuadas, y oraciones cortas y simples. Deben evitarse los modismos y similares. También es posible emular a otros autores para engañar al análisis. Si todo lo demás falla, simplemente esperar puede ayudar. El estilo de escritura de una persona cambia a lo largo de los años, por lo que es poco probable que un documento escrito por usted hace varios años sea fácil de relacionar con lo que escribe ahora. Esto no significa que sea imposible, solo que más difícil.