Estoy explorando una solución que permitiría a las grandes empresas de tecnología permitir el acceso a su base de datos para su análisis, de una manera que protegería la privacidad de sus usuarios. Me encantaría recibir comentarios sobre la idea.
El problema Muchas grandes empresas, especialmente las redes sociales, reciben solicitudes de organizaciones sin fines de lucro, organismos de control y otras entidades gubernamentales para inspeccionar el impacto de su software. Por ejemplo, algunas ciudades quieren que Airbnb publique datos sin procesar para que puedan analizar el impacto de la vivienda en los costos de alquiler o si esto lleva a la discriminación. Las empresas dudan en publicar datos anónimos en bruto, porque a menudo es fácil volver a identificar a los usuarios con sofisticadas técnicas estadísticas.
Idea de solución Permitir el análisis de datos anónimos en bruto, pero públicamente. Cualquier entidad gubernamental o sin fines de lucro que quisiera acceder a la base de datos tendría que hacer públicas todas las consultas / órdenes. Cualquier persona que analice los datos tendrá que ser verificada para su ID real. Todo sería público sobre el análisis.
En lugar de permitir que los usuarios descarguen los datos, el software solo enviaría los resultados a una consola de comandos. Todos los datos se mantendrían localmente en los servidores de la empresa, se realizarían los cálculos internamente y luego se imprimirían los resultados en algún tipo de sitio web visible públicamente, para cada comando y salida.
Si alguien comenzó a hacer consultas que se sospechaba que intentaban volver a identificar datos anónimos, creo que sería bastante obvio. La re-identificación es posible, pero requiere cierto trabajo y algunas técnicas específicas enfocadas en identificaciones particulares.
¿Sería esto técnicamente posible? Gracias por los comentarios!