Comparando el hash MD5 con un documento de Word modificado y revertiéndolo a original

0

Así que quise hacer una pequeña prueba rápida al comparar hashes entre un documento de Word y una pequeña modificación dentro del documento y luego revertir los cambios al original y verificar los 3 hashes. Por supuesto, el hash original y el documento modificado serán diferentes, pero ¿por qué es que cuando cambié el documento de nuevo a la forma en que originalmente terminó teniendo un hash diferente cuando tienen el mismo contexto?

    
pregunta Legacy09 10.02.2017 - 23:13
fuente

3 respuestas

2

Como otros lo han señalado en los comentarios, un documento de Word es más que solo el texto visible que se ve. Varios archivos de metadatos (como la última vez que se modificó o el historial de 'cambios de seguimiento') se almacenan dentro del archivo. Si solo se cambiara un bit de un byte, el hash sería completamente diferente.

Si desea averiguar qué bits tienen cambios, puede comparar el original con la copia modificada y luego modificada con una herramienta como el comando "cmp" (comparar archivos) de Unix , que le dirá la ubicación del byte de la diferencia de furst.

O, rompe tu editor hexadecimal favorito para examinar los bytes en cada archivo, y encontrarás tu cambio no visible.

También, como otros lo señalaron, su caso es particular a Word (y otros formatos de archivo de almacenamiento de metadatos). Si intentara este experimento con un archivo de texto plano ASCII, vería que el archivo de nuevo modificado tiene el mismo hash que el original.

    
respondido por el JesseM 11.02.2017 - 02:13
fuente
1

Como han publicado otros, los documentos de Office / Adobe contienen metadatos (así como otros formatos de documentos). Puedes intentar eliminarlos pero YMMV.

enlace

    
respondido por el w21froster 11.02.2017 - 01:23
fuente
1

Su hash cambió porque la metainformación (por ejemplo, la fecha de la última modificación) cambió

En realidad, Word tiene una función incorporada que generará un hash (y una firma digital) para usted. Se llama Insertar línea de firma . Si bien el propósito principal de esta función es permitirle proporcionar su firma, también vincula esa firma a un hash digital del contenido para que pueda probar si alguien modificó el documento después de firmarlo.

También puede eliminar la metainformación en el documento de Word guardándola en un formato simple (por ejemplo, formato de solo texto UTF-8). Consulte esta respuesta para obtener la respuesta de otra persona sobre cómo hacerlo. .

    
respondido por el John Wu 11.02.2017 - 02:27
fuente

Lea otras preguntas en las etiquetas