Anonimización de datos para aplicaciones

0

Intento diseñar un sistema que lee eventos provenientes de dispositivos, los almacena y expone la API a varias aplicaciones. Originalmente quería introducir un módulo traductor de identificación , por lo que almacenaría solo una identificación de dispositivo anónima en una base de datos. Luego se protegerá de la recolección de datos no autorizada.

Luego quise tener otro módulo llamado Roles Registry responsable de manejar los permisos de API para cada aplicación. Tenía una idea en mente que la aplicación que desea trabajar con un ID de dispositivo concreto necesitaría un permiso diferente al de la aplicación que usa identificadores anónimos.

Otro módulo API de acceso a eventos sería un punto de entrada único para el acceso a datos y evaluaría si el permiso de API se otorgó a la aplicación.

Pero cuando empiezo a pensar en ello, creo que este concepto es débil. Es difícil de explicar porque hay miles de preguntas ¿Qué pasa si llegan a mi mente? Considero que algunas son probables, rechazo otras, etc. Necesito especificar claramente mis requisitos y encontrar consecuencias.

Quiero

  1. base de datos anónima para que ninguno de los administradores pueda buscar datos de id de evento específico
  2. la búsqueda por el ID de dispositivo concreto requeriría un conjunto de permisos diferente al de la búsqueda anónima por otros criterios

Pero veo el problema principal con los datos devueltos:

  1. Si la API devuelve una identificación artificial, la persona que llama puede guardarla y luego puede usar la API anónima la próxima vez
  2. Si la API devuelve la identificación real del dispositivo, entonces la API necesita acceso a la base de datos de Id Translator (realmente big data, acceso rápido) y luego el administrador puede asociar fácilmente los datos anónimos con la identificación del dispositivo concreto

Puede que no sea resuelto y solo debo omitir el primer requisito (protección de administrador).

Le agradecería

  1. Cualquier información sobre cómo diseñar dicho sistema y API
  2. ¿Cuál es la mejor práctica?
  3. ¿Se anonimizarán los datos en la base de datos?
  4. ¿La API devolverá el identificador de db anónimo o la identificación del dispositivo real?

Gracias.

    
pregunta Leos Literak 19.03.2014 - 14:47
fuente

2 respuestas

1

Estaba leyendo sobre el problema de anonimización el otro día. De hecho, la primera edición de lo que estaba leyendo está en línea, en enlace

Esto es de Ross Anderson en Cambridge, quien es bien conocido en la comunidad. Quieres uno de los capítulos de Ingeniería de seguridad, que comienza en SE-01.pdf, pero hay otras cosas allí en su blog.

    
respondido por el davecb 19.03.2014 - 15:54
fuente
1

Desea utilizar enmascaramiento dinámico de datos. Hay diferentes productos en ese espacio. Eche un vistazo a Oracle VPD (Virtual Private Database), Informatica DDM o Axiomatics Data Access Filter, que proporcionan medios para definir políticas en cuanto a lo que puede ver / no ver.

Estas herramientas están diseñadas para proteger los datos, que parecen estar en la línea de lo que se quiere lograr.

Si desea obtener una buena lista de capacidades, proveedores, alternativas de código abierto, consulte los informes de Gartner, en particular el Cuadrante Mágico al que Informatica le brinda acceso gratuito. Consulte aquí .

    
respondido por el David Brossard 21.03.2014 - 22:40
fuente

Lea otras preguntas en las etiquetas