Más sobre la anonimidad y reidentificación en ficheros de microdatos

Ha tenido cierta repercusión durante el verano el articulo Estimating the success of re-identifications in incomplete datasets using generative models, del que se han publicado resúmenes tales como Bastan tres datos para identificar a cualquiera en una base anónima. Cosa sobradamene conocida desde hace la tira.

De hecho, se ha publicado esta herramienta para conocer tu riesgo de ser reidentificado, caso de que vivas en EEUU o el RU.

¿Y si vives en España? Siempre puedes leer esto, de lo que ya hablé (y resumí) aquí.

Y, finalmente, si quieres un tratamiento distinto (y más general, basado en teoría de la información) al del artículo sobre cuánta información permite la reidentificación de gente… échale un vistazo a esto.

Nota: Buscándome, he encontrado esto. ¡Me cita un estudio de la Agencia de Protección de Datos!

Otra nota: Lo de la fecha completa de nacimiento es tongo. Solo con ese dato y el municipio se reidentifica a cantidad de gente. Casi nunca se comunican las fechas exactas de nacimiento/defunción en microdatos públicos. Eso es de primero de privacidad.

Nota final: Y precisamente por lo anterior son tan poco conocidos los fenómenos de la (muy notable) estacionalidad intrasemanal de la mortalidad y la natalidad.