Básicamente, tomará demasiado tiempo lograr un resultado satisfactorio, abordando ambos: generar la parte de video faltante (según criterios computables) y clasificar los mejores de ellos (eso necesita humanos). inteligencia o IA extremadamente desarrollada). Incluso si finalmente tienes un buen video que cumple todos los criterios, nunca sabrás si la película original tenía el mismo contenido. Puede que no tenga sentido intentar "reconstruir" algo que puede ser más variable, mejor y más rápido: usa tu propia fantasía.
Ciertamente, algunos valores de hash de 10 bytes "cruzados" no pueden representar / contener la información de 10 MB, por lo que creo que su esencia es la siguiente:
Incluso si tiene mucha información adicional para las correcciones dentro de todo el archivo de video: formato de datos, cuadros, el guión gráfico en sí mismo, voces de los actores y así sucesivamente: habrá miles de videos más o menos diferentes que se ajustan a todos los criterios conocidos. Incluso asumo que un puñado de fotogramas individuales aquí y allá podría hacer que cualquier video lleve a los mismos hashes.
Esta pregunta es muy parecida: ¿es posible que un virus (pequeño) se agregue a un archivo (grande) mientras mantiene la suma de comprobación del archivo con el mismo valor rellenando una cantidad (no tan grande) de bytes variables? Supongo que es posible, aunque difícil de calcular a tiempo hoy. Por otro lado, sabemos que muchos códigos posibles conducen al mismo hash, por lo que el tiempo de computación podría ser sobreestimado. Tal vez sea posible en segundos , solo los piratas informáticos lo sabrán
Editar: Durante la noche me inspiré para una buena comparación adicional de su "problema de parte de video perdido": para tales casos (recuperación completa de datos) ya se ha inventado el < tecnología> RAID-5 fuerte (Wiki vea aquí: enlace ). Uno de cada tres o más discos duros puede fallar y todos los datos pueden reconstruirse sin pérdida. Ciertamente, tiene muchos gastos generales de datos (redundancia para corrección de errores) almacenados en todas las unidades para poder hacerlo.
Hashes / Checksums son buenos para la detección de pequeñas manipulaciones / errores (bits o pocos bytes) que ocurrieron en algún lugar dentro de un archivo. Más avanzados son los CRC con corrección de errores. Al menos tenemos sistemas de redundancia como RAID.