Estoy tratando de encontrar una manera segura de almacenar las claves secretas utilizadas en el hashing de los números de seguridad social.
La idea es la anulación de la identificación de los sujetos de investigación, pero aún así permite realizar seguimientos a través del hash de una clave secreta concatenada con el SSN y usarla como identificador único.
Los pasos que he concebido son los siguientes:
- En el momento 0, cuando se recopilan datos sobre el sujeto A, genere aleatoriamente una clave secreta y concaténela con el SSN antes de codificarla.
- Reemplace el SSN con el valor de hash. Este registro no identificado se utilizará para fines de investigación.
-
Almacena el SSN y la clave secreta generada de alguna manera.
-
En el momento 1, cuando se recopilan más datos del sujeto A, queremos agregar estos nuevos datos a los datos recopilados anteriormente. Busque la clave secreta usando el SSN y luego vuelva a aplicar hash para obtener el valor de hash requerido.
Estoy luchando en el Paso 3 y buscando las mejores prácticas en este escenario. Parece que si simplemente almacenara el SSN junto con la clave secreta en un archivo de texto, entonces el riesgo de reidentificación es alto una vez que el intruso tenga acceso al archivo.
Cualquier ayuda es muy apreciada!