EDITAR:
[N.B: Reemplazé completamente la pregunta original que no era una muy buena declaración del problema (ver comentarios) con una más adecuada.]
Tengo registros que contienen, entre otras cosas, la ubicación de los usuarios y su ID (es una gran cantidad de datos). Necesito proporcionar a un tercero la ubicación de los usuarios. (El flujo también se filtra en función de otros criterios en el flujo y tal vez incluso se combina con otras fuentes de datos que contienen ID de usuario, si es de interés aquí y ahora).
No debo pasar las ID de usuario a terceros.
Los registros que tiene una salida deben permitir a la tercera parte crear "rutas" y / o mapas de ubicación de los usuarios que varían en el tiempo durante un período de tiempo (por ejemplo, un día pero mucho más de una hora). Para ello, deben ser capaces de identificar los registros que pertenecen al mismo usuario. Por lo tanto, se debe pasar alguna clave.
Una restricción importante que constituye el núcleo del problema:
Para la discusión, permítame definir "ID de usuario anonimizado" un atributo que se deriva de los atributos de los registros de entrada de tal manera que es (casi) exclusivamente derivable de la ID de usuario (por ejemplo, una ID de usuario con sal con hash o una fija asignación aleatoria), y se coloca en los registros de la secuencia de salida para que los registros que pertenecen al mismo usuario puedan ser identificados.
Las regulaciones legales y las normas internas son tales que debo asegurarme de que la "identificación de usuario anonimizada" no se pueda reproducir durante más de una hora. (Solo como un ejemplo ilustrativo: si utilizara un hash con sal del ID de usuario como "ID de usuario anónimo" tendría que usar una nueva sal cada hora).
(Nota: como se mencionó anteriormente, la tercera parte tiene que asignar ubicaciones a los usuarios durante más tiempo. Aún no les importa la identidad del usuario, pero deben saber que es el mismo usuario todo el tiempo).
Y las preguntas son: ¿Hay alguna forma de hacer esto? Si es así, ¿cómo?