Datos públicos, datos DUP
Hoy en día, en España, salvo por unas cuantas honrosas excepciones no existen datos públicos, sólo datos manejados dentro de las administraciones públicas (y a los que los ciudadanos no tienen acceso).
Los datos públicos deberían ser datos DUP: disponibles, ubicables y procesables.
Existen d-iniciativas en España. Sería injusto no reconocer que administraciones y organismos públicos no han venido haciendo un esfuerzo (todo lo desigual e insuficiente que se quiera) por poner su información al alcance de la ciudadanía. Me honra como zaragozano encontrar al ayuntamiento de mi ciudad entre los pioneros.
Pero da la sensación de que nos falta en España una ley que consagre el derecho al acceso a la información y lo convierta en algo más que una gracia concedida por las administraciones. En esa dirección se mueven plataformas tales como Pro Bono Publico, que luchan por equiparar nuestra legislación a la que impera en Estados Unidos o el Reino Unido.
Pero escaso es el valor de la información si no es ubicable. Aun cuando ayuntamientos, comunidades autónomas, empresas públicas, ministerios, comunidades autónomas, etc. recopilasen tablas y las colgasen en la red, resultarían inútiles si no fuese sencillo encontrarlas. Compárense las soluciones propuestas por los Estados Unidos o el Reino Unido con la española, aporta.es, (en la que no he sabido todavía encontrar nada).
Es posible que en este sentido sea la iniciativa privada la que complemente a la pública a través de servicios tales como
- zanran, el Google de los datos y la estadística o
- Get the Data, su versión social.
(Y adelanto que pronto publicaré noticias muy jugosas sobre este tema).
Finalmente, los datos han de ser procesables, hay que contar con herramientas que permitan exprimilos, representarlos, cruzarlos, compararlos. Ya conocemos Gapminder. Y hablé también recientemente de NComVA. Aunque desde esta bitácora nos guste promover el tipo de análisis más profundo que podría realizarse con R. Esta es, en el fondo, la idea que motivó el desesarrollo todavía incipiente del paquete pxr, que permite leer directamente desde R datos con el abstruso formato en el que le gusta publicarlos al INE.