Números

UbiData.org, disponible en beta

He hablado en estas páginas de zanran, un Google para datos, y de GetTheData, su versión social. Hora es cumplida de que mencione a UbiData, el GetTheData en español.

UbiData (en latín, ¿dónde están los datos?) es un portal que he creado para que la comunidad hispanoparlante pueda intercambiar información sobre dónde encontrar conjuntos de datos. Está principalmente pensado para facilitar la labor de investigadores, estadísticos, estudiantes, periodistas, etc. que quieren estudiar un determinado asunto y no logran dar con esa información que tiene que estar en algún sitio pero que no se deja encontrar en la maraña de enlaces, sugerencias confusas o desactualizadas.

Grandes números

  • 400 euros cuesta un disco duro en el que almacenar toda la música del mundo
  • Hay 5.000 millones de teléfonos móviles funcionado
  • 30.000 millones de contenidos circulan por Facebook cada mes
  • Los datos generados mundialmente crecen un 40%, frente al 5% que se incrementa el gasto en tecnologías de la información
  • La biblioteca del Congreso de Estados Unidos almacena 235 TB de información
  • Pero las compañías de 15 de 17 sectores económicos de EE.UU. poseen bases de datos aún mayores
  • El valor que pueden aportar los datos de salud en EE.UU. podría superar los 300 millardos de dólares, el doble que el gasto sanitario en España
  • Y 250 millardos de valor a las administraciones públicas europeas, más que el PIB de Grecia

Para saber más, el informe de McKinsey sobre datos grandes completo.

Datos públicos, datos DUP

Hoy en día, en España, salvo por unas cuantas honrosas excepciones no existen datos públicos, sólo datos manejados dentro de las administraciones públicas (y a los que los ciudadanos no tienen acceso).

Los datos públicos deberían ser datos DUP: disponibles, ubicables y procesables.

Existen d-iniciativas en España. Sería injusto no reconocer que administraciones y organismos públicos no han venido haciendo un esfuerzo (todo lo desigual e insuficiente que se quiera) por poner su información al alcance de la ciudadanía. Me honra como zaragozano encontrar al ayuntamiento de mi ciudad entre los pioneros.

El problema de la media, el problema con la media

Debiera comenzar asumiendo y reconociendo mis deficiencias pedagógicas a la hora de elegir y presentar el problema sobre la media de la semana pasada. Espero que quienes hicieron comentarios al respecto —y quienes los pensaron sin escribirlos— no reciban esta entrada con el “buuuuu” que tal vez merezco.

El problema de la media es más bien un problema con la media. No es en él tan interesante la solución —y nadie debería pensar que en estas páginas planteamos problemas rancios como aquéllos sobre cuadernos, lapiceros y pesetas con que entretuvimos alguna tarde de la infancia— como su discusión.

Los finalistas del Desafío AbreDatos 2011

El Desafío AbreDatos 2011 es un concurso que se celebró los días 7 y 8 de mayo para el desarrollo exprés (¡en 48 horas!) de servicios tecnológicos para el ciudadano basados en el uso de datos públicos. Los finalistas son:

  • AbreLibros
  • Presupuestos CCAA
  • TrikTrack
  • El Disparate
  • La lista de la compra
  • Aquí os quedáis
  • Cómo está el panorama
  • e.nergy

Invito a los lectores de este blog a participar en la votación, que está abierta hasta el 29 de mayo, y, tal vez, a animarse a participar en las próximas convocatorias.

Terrorismo y sesgos en la percepción de la improbabilidad

En el Financial Times del 3 de mayo aparece un artículo de Gideon Rachman que es de los pocos que merece ser leído sobre el fatigoso y como se verá poco relevante tema de la muerte de Bin Laden. Y es interesante —y relevante para los lectores de esta bitácora— porque toca un tema del que ya nos hemos ocupado y que seguro que revisitaremos: el de las probabilidades subjetivas y, en particular, el de las distorsiones con las que los seres humanos percibimos y calibramos probabilidades pequeñas.

¿Cuánto cuesta criar un buey?

Por ser viernes, por estar aún de vacaciones en un país famoso por sus vacas y porque mis lectores estén al tanto de una bitácora que no hay que perderse —que es de la que extraigo las dos imágenes que aparecen a continuación—, va una de bueyes.

Primero una foto:

¿Cuánto petróleo necesita un buey para criarse?

En ella, aparece un buey de 567 kg. llamado Grandview Rebel junto a unos barriles que representan el petróleo que ha requerido criarlo: 1.071 litros. Cada kilo de carne de buey necesita 6,25 litros de petróleo. Eso explica la siguiente gráfica,

Canadá 1 - EE.UU. 0

Desde esta bitácora hemos seguido siempre con suma atención las iniciativas públicas de diseminación de datos. Tal vez por ver si cunde el ejemplo en nuestras latitudes.

Al rol de gobiernos concienciados en la importancia de contar con un portal desde el que centralizar esta fundamentalísima función democrática se ha sumado recientemente Canadá, que ha seguido los pasos de su metrópoli .

Sin embargo, es triste tener que dar noticia en estas páginas de que uno de los proyectos más sólidos y de mayor alcance está en peligro: menos de 10 centavos de dólar cuesta a cada estadounidense su data.gov y aun así va a caer víctima de los recortes presupuestarios. Es difícil abundar en el tema sin realizar valoraciones políticas (a las que esta bitácora quiere mantenerse ajena).

¿Nos leen (y más) en El País?

Pues no lo sé. Es imposible probarlo o refutarlo sin realizar el par de llamadas que no haré. Pero leyendo el reportaje Aquí no caben todos del día 10 de abril firmado por Ramón Muñoz sobre las fabulosas cotizaciones bursátiles potenciales que se atribuyen a las redes sociales, tropecé con el siguiente párrafo:

Para hacerse una idea de este desajuste, si aplicáramos el mismo multiplicador ingresos/valoración de Facebook a Telefónica, la operadora española valdría en Bolsa 1,82 billones de euros (frente a los 81.700 millones a los que cotiza realmente), es decir, cuatro veces más que toda la capitalización bursátil de las 35 empresas del Ibex juntas. Con la diferencia, además, de que Facebook, que vive de la publicidad como muchas de las nuevas firmas, no factura directamente (ni tiene previsto hacerlo) ni un dólar a ninguno de los 600 millones de usuarios que tiene en el mundo, mientras que la operadora española cobra religiosamente la factura cada mes a sus 287 millones de clientes.

¡Qué prensa tan mala!

Al autor de estas páginas se le cae la baba con las infografías del New York Times (¿sabéis que en ese periódico usan R?) y de The Guardian. Y esperaba, ¡qué menos!, algo si no ya similar, al menos sí decente del, dicen, más serio de los periódicos españoles.

Pero hoy se me ha caído el alma a los pies. Fijáos, fijáos lectores:

¿Veis cómo los porcentajes no tienen nada que ver con las cifras absolutas? Comparad Europa con Oriente Próximo. O con Oceanía. ¿Alguien entiende algo?

A esa gente le había hecho falta un matemático

A esa gente le había hecho falta, en efecto, un matemático. Les hubiera bastado saber mi número de teléfono y no habrían cometido tamaña tontería y habrían tenido a sus accionistas más satisfechos. Explicaré el asunto. Será muy instructivo para quienes opinan que no valemos para gran cosa.

Hace mucho, mucho tiempo, tanto que las neuronas que se acuerdan de eso están llenas de polvo, en un país muy, muy lejos de éste, trabajé en un proyecto cuya naturaleza no viene al caso. Sí que lo hace el que habían codificado el campo identificador de los contratos en su base de datos con un CHAR(26). Sí, efectivamente, usaban veintiséis caracteres para identificar un único contrato.

Economía y estadística en la Reserva Federal

El grupo de investigación y estadística de la sede de la Reserva Federal en Nueva York ha iniciado un encomiable proyecto de divulgación: una bitácora en la que presentar con un lenguaje accesible los asuntos sobre los que trabajan. Además, y según sus propias palabras, aspiran a entablar un diálogo con sus lectores participando en los debates que se abran en la sección de comentarios.

Además de promover esta bitácora, la Reserva Federal quiere estar presente y acudir a donde están los ciudadanos a los que sirve: está en YouTube, Twitter, etc.

Por la apertura de los datos públicos

En navegaciones sin rumbo por internet di con una asociación con un proyecto muy prometedor, Pro Bono Público. Aunque no he tenido la ocasión —todavía— de contactar con ellos, creo que los lectores de esta bitácora compartirán conmigo el interés por esta iniciativa.

Además, aquéllos de mis lectores que tengan más tiempo y arte que yo —y estoy pensando en concreto en una muy fiel seguidora que tiene buena mano para estas cosas— puede que quieran participar en el Desafío Abredatos 2011, que se celebrará próximamente bajo su patrocinio.