Números

741 millones de barriles de petróleo, ¿mucho o poco?

Nos amaneció el otro día la prensa con la noticia de que Repsol YPF ha descubierto 741 millones de barriles de petróleo en Argentina. De hecho, periódicamente se realizan hallazgos de mayor o menor cuantía.

Y se nos presentan en la prensa con tan falta de contexto y en términos tan ponderativos que es difícil hacerse una idea de lo minúsculos que resultan si se analizan bajo una perspectiva menos anumérica.

¿Es abierto todo lo que reluce? Resultados

Habiendo hecho eco el otro día en esta bitácora del anuncio de un estudio del grado de real de apertura de los datos del proyecto Aporta, de rigor es que haga mención de los resultados.

En resumen:

  • El 3% de las fuentes de datos que comprende el proyecto cumplen los requisitos mínimos de apertura
  • El 39% de las fuentes de datos catalogadas contienen datos propiamente dichos (y no imágenes, documentos, etc.)
  • En términos de formatos, el 88% (¿del 39% anterior?) son adecuados
  • El 40% permite el acceso directo a la información
  • El 15% de las fuentes de datos permitían la reutilización

¡Pobre resumen!

Medias de medias... ¿a estas alturas de siglo?

Lo sospechaba y ha resultado ser cierto: media de medias. ¡Carajo! El siguiente gráfico que compara la tasa media de paro entre el norte y el sur de España está extraído de El Economista:

¿Cómo se han calculado los porcentajes? Veámoslo (a partir de los datos que aparecen en el artículo); para el sur, promedia las tasas de paro de cada comunidad autónoma así:

mean( c( 30.93, 29.55, 22.44, 24.73, 23.6, 24.19, 33.2, 23.81 ) )
# [1] 26.55625

Operación que, obvia decirlo, sólo sería correcta si la población de todas las comunidades autónomas implicadas fuese, cuando menos, similar (y, p.e., la población de Andalucía fuese comparable a la de Melilla).

Twain, Grecia, Pisa, Cataluña y deontología

Leí un chiste el otro día: aparecía el ministro de economía de Grecia en su despacho revisando unos informes y comentándole a su asesor: “La única solución es volver a mentir”. No sin cierta dosis de razón nos recuerdan de vez en cuando la cita —de problemática atribución a Mark Twain—: Hay tres tipos de mentiras: mentiras pequeñas, mentiras grandes y estadísticas.

Ahora nos enteramos de que Cataluña maquilló el resultado del examen de PISA a la educación:

¿Es abierto todo lo que reluce?

Doy publicidad aquí a una entrada de la bitácora gobernamos.com en la que se presenta un estudio acerca del grado real de apertura de los datos del proyecto Aporta.

Para los detalles puede consultarse la entrada original. Pero quiero extraer de ella la referencia al documento Methodology for Releasing Open Data (MELODA), que establece un criterio o método (¡odio emplear metodología!) para determinar el grado de apertura de una fuente de datos, que en su versión simplificada, evalúa si:

Liquidez y solvencia

El bombardeo matinal de noticias a que nos tiene acostumbrada la prensa en los últimos tiempos debería tener el efecto secundario positivo de acrecentar nuestra cultura financiera. Pero no estoy seguro de que sea así.

Uno de los grandes temas que me da la impresión que confunde todavía al público es la diferencia entre liquidez y solvencia.

Yo soy un tipo eminentemente ilíquido: muchos días me enfrento al siguiente problema: aunque pueda permitirme innumerables cafés a razón de 35 céntimos, en ese momento crítico, delante de la máquina expendedora, nunca encuentro la calderilla necesaria.

Estrategia, predicción y proyección de la población española

Cayó el otro día en mis manos un artículo, Strategy under Uncertainty, que complementa bastante adecuadamente mi entrada del otro día sobre las proyecciones a corto plazo de la población española que realiza el INE.

La estrategia concierne a sucesos futuros. Por ser futuros, son inciertos. Y el artículo describe cuatro niveles distintos de incertidumbre a los que contrapone una serie de posibles estrategias. Los niveles son:

  1. Un futuro suficientemente claro: las tendencias son muy claras y no se esperan sorpresas. En resumen, hay un único escenario posible y la estrategia adecuada consiste en adaptarse a él.
  2. Varios futuros alternativos: existe un número concreto de alternativas o escenarios, cada uno de las cuales con su propia probabilidad de ocurrir. Por ejemplo, los bares barajaron recientemente dos posibles alternativas: la futura ley podría prohibir fumar taxativamente (como ocurrió) o permitir tal vicio en áreas específicas y adaptadas. A cada suceso puede asignársele una probabilidad discreta, diría un matemático.
  3. Un rango de futuros: no existen escenarios discretos y concretos, pero sí un rango de opciones: la demanda puede ser cualquier cifra entre 0 y 1000, etc. Nuestro matemático entendería que este es un problema en el que rigen leyes de probabilidad continua.
  4. Absoluta incertidumbre: ocurre cuando es imposible plantear cualquier tipo de función de probabilidad. No obstante, aunque el artículo recoge algunos casos, subraya también que este tipo de situaciones son inestables y suelen degenerar con el tiempo en alguna de las situaciones anteriores.

Las tres estrategias fundamentales consisten en:

Riesgo en proyectos de IT

Tu proyecto de IT puede contener más riesgo del que piensas. De verdad. Dan fe de ello Bent Flyvbjerg y Alexander Budzier.

Los autores describen en el artículo que he enlazado encima varios proyectos que fracasaron estrepitosamente y proporcionan algunos consejos para evitar ese tipo de desenlaces. Sin embargo, para quienes siguen esta bitácora, la reflexión más interesante es la siguiente:

Al focalizarse en las medias en lugar de los casos extremos más dañiños, la mayor parte de los gestores y consultores han ignorado el verdadero problema.

Las proyecciones de la población de España a corto plazo del INE no valen para un carajo

Las proyecciones de la población de España a corto plazo del INE no valen para un puto carajo. Tal vez sí para conseguir unos cuantos titulares en prensa como este, este o este otro.

Pero no para lo que se supone que sirve. Además, por construcción. En el documento que explica qué son y para qué sirven dichas proyecciones se lee (con mi subrayado)

La Proyección de Población de España a Corto Plazo elaborada por el INE constituye una simulación estadística del tamaño y estructura demográfica de la población que residiría en España […] en caso de mantenerse las tendencias y los comportamientos demográficos actualmente observados.