¿Se considera que los códigos postales son información de identificación personal?

24

Un sitio web público de una empresa financiera (cae bajo la SEC) tiene un mapa HTML 5 de los EE. UU. donde cada punto del mapa es el código postal de 5 dígitos de sus clientes. Estos puntos se generan a partir de un archivo CSV que se extrae del servidor al navegador para que realmente pueda descargar el archivo CSV usted mismo. El archivo CSV contiene la ciudad, el código postal y la latitud / longitud del código postal, no la dirección de la calle del cliente.

Me preguntaba, ¿los códigos postales solo se consideran información de identificación personal?

    
pregunta cflyer 31.12.2015 - 19:03
fuente

5 respuestas

53

Una vez, Netflix planeó tener un concurso (para mejorar las recomendaciones de películas) en el que publicarían el historial de alquiler de películas, reseñas de películas a lo largo de sus fechas de nacimiento, género y código postal de cinco dígitos. Esa combinación es información de identificación personal y podría hacer cosas como la identidad sexual privada de alguien si se pudiera inferir de su historial de alquileres.

Un estudio famoso descubrió que con la fecha de nacimiento, sexo y código postal de cinco dígitos, puede identificar de forma única aproximadamente 87 % de estadounidenses . También descubrió que usted podría identificar de manera única a aproximadamente 100,000 estadounidenses (0.04%) por la combinación de año de nacimiento, género y código postal.

Para la desidentificación médica de la información médica protegida (PHI), El Departamento de Salud y Servicios Humanos de EE. UU. sugiere truncar los dos últimos dígitos del código postal de cinco dígitos desactivado, a excepción de 17 titulares de códigos postales raros (donde menos de 20,000 personas comparten estos tres dígitos iniciales) según el Censo de los Estados Unidos) (específicamente 036, 059, 063, 102, 203, 556, 692, 790, 821, 823, 830, 831, 878, 879, 884, 890, 893) en cuyo caso debe reemplazar la cremallera Código con todos los ceros.

De manera similar, debe tener en cuenta que los campos como la edad en los casos excepcionales son raros (por ejemplo, solo hay un estadounidense con una edad de 116 años), por lo que HHS recomienda agrupar estas edades excepcionales en una categoría (por ejemplo, 90+). Probablemente también sea mejor agrupar a otros usuarios en categorías de edad (como 50-55) para ayudar a anonimizarlos aún más.

    
respondido por el dr jimbob 31.12.2015 - 20:42
fuente
15

Por sí mismo, no. No se puede identificar a una persona simplemente conociendo el código postal de esa persona. El código postal es simplemente información demográfica.

Sin embargo, es posible que pueda combinar una gran cantidad de elementos demográficos individuales para identificar a alguien. El código postal + Edad + Sexo + Ingreso podría ser suficiente para identificar a alguien. Si le dijera que la Persona A era de sexo masculino, tenía 60 años, vivía en el código postal 98039 y tenía un ingreso de 2 mil millones de dólares el año pasado, podría suponer que estaba hablando de Bill Gates. (No tengo idea de cuánto ganó Bill el año pasado, pero estoy tratando de ilustrar un punto).

El punto es que el agregado de información demográfica individual no PII puede convertirse en PII.

    
respondido por el Steve Sether 31.12.2015 - 19:31
fuente
7

Sí, por supuesto, es información de identificación personal. Proporciona información de identificación sobre una persona, ¿por qué en el mundo podría considerarse de otra manera?

Considere a un comerciante de una pequeña ciudad que diga "Creo que invertiré en [compañía muy impopular] cuando llegue a casa esta noche". Su cliente dice "si lo haces, ¡nunca volveré a comprar aquí!" Esa noche, el cliente ve que aparece otro inversionista en el mapa de la compañía para ese código postal.

¿Consideraría que no es razonable que el cliente deje de comprar en esa tienda? ¿Considerarías irrazonable a los demás, al escuchar esta historia, dejar de comprar allí? Recuerda, pequeña ciudad, probablemente no había ningún inversionista desde allí antes.

¿Consideraría razonable que el comerciante luego demandara a la compañía por filtrar su información de inversión privada y, por lo tanto, causar daños a su negocio?

Por lo tanto, el número potencial de códigos postales en los que la combinación de [es un usuario del servicio de ese lado web] y [vive en ese código postal] y [cuando comenzaron a invertir] se identificarán de forma única es, obviamente, bastante grande.

Pero es peor que eso.

Los siguientes códigos postales tienen una población de exactamente una persona: 05141, 67843, 88264, 98222, 99790. Hay más de cien códigos postales con poblaciones menores de 10. 11109 tiene un área de solo dos cuadras de la ciudad. Si vives en 38639 también eres negro. Si vives en 02562 eres blanco (más del 99% de probabilidad para ambos). Si vives en Beverly Hills 90210, eres rico y todos lo saben. Si vives en 90209, todavía eres rico, pero es probable que tengas un chip en tu hombro porque tu código postal es menos famoso.

Hay un poco menos de 8 mil millones de nosotros. Eso significa que solo necesitamos "33 bits de entropía", es decir, 33 preguntas sí / no que dividen a la población aproximadamente a la mitad, como "eres hombre", "vives fuera de China / India", etc. para identificar a cualquier individuo. Un código postal proporciona entre 16 bits de información (los dos códigos postales más poblados tienen más de 110,000 personas) y el total de 33 (esos 6 códigos postales anteriores). Es decir, solo un código postal es al menos la mitad de la información necesaria para identificar a alguien de forma única.

[Editar: y, por supuesto, en los EE. UU., las empresas son personas. Muchas, MUCHAS compañías con una población técnica de cero tienen sus propios códigos postales. Si esa compañía invierte en otra compañía, es posible que NO les guste que la información se publique públicamente.]

[Edit2: Los códigos postales se mencionan explícitamente como PII por Massachusetts ( enlace ) y California ( enlace

    
respondido por el Dewi Morgan 31.12.2015 - 22:58
fuente
4

En los Países Bajos, tanto CPB (institución gubernamental para las estadísticas) como CBP (organismo de control gubernamental para la privacidad, tanto en el ámbito comercial como gubernamental) concluirán que el conjunto de datos que tiene contiene información de identificación personal. Su razonamiento será el más probable:

  1. Un código postal puede identificar, por ejemplo, < 100 personas con la coincidencia más fuerte y puede identificar < 2500 personas sin el sufijo (eliminando los dos últimos caracteres de las seis posiciones). Los primeros cuatro identifican la región en el mapa y los dos últimos la subregión que incluso identificará de qué calle se encuentra en algunos casos;
  2. Como solo se enumera a los clientes, cualquier éxito identificará al cliente en esa área de manera indirecta, a menos que usted sea la empresa de telecomunicaciones con una participación de mercado de más del 50% en esos códigos postales. Si tiene 1 en 1000 o incluso 100 personas como cliente, puede identificar qué impacto será qué cliente se combinó con algunas excavaciones;

Esto puede parecer extremo, pero en un estudio de caso para datos médicos se comprobó en los Países Bajos que las personas podrían identificarse si solo se agregara un detalle adicional de un tercero para establecer la relación con su "entrada de pseudo datos" (zip basado en el código). En algunas situaciones, solo estaba navegando en Google Maps para encontrar ese detalle.

Pero como indica que esto es para una institución financiera, entonces realmente tiene que discutir esto con su administrador de riesgos. Además, como otros lo han identificado como un problema en otros países.

    
respondido por el hspaans 01.01.2016 - 04:17
fuente
3

No, por sí mismo, un código postal no es PII. Son datos demográficos, pero dado que muchos miles de personas pueden vivir en un solo código postal, no hay nada solo en el código postal que identifique a qué individuo (s) representa. En este caso, un código postal también puede representar a varios clientes, si hay varios clientes de la empresa en un solo código postal. Entonces, casi por definición, no puede ser PII, ya que no identifica de manera única a un solo individuo.

    
respondido por el Xander 31.12.2015 - 19:12
fuente

Lea otras preguntas en las etiquetas