Números

Si participase en MadData...

El otro día ayudé a divulgar por aquí MadData, el datatón de datos abiertos del ayuntamiento de Madrid. Algunos me habéis preguntado si participaré. Pero estoy lejos (y, muy, muy ocupado).

Eso sí, os voy a contar dónde me gustaría meter la cuchara. En datos del ayuntamiento de Madrid, claro. Pero no los abiertos, ni los públicos, ni los conocidos. Sino los otros.

Os pongo en precedentes. Sabréis —si habéis seguido estas páginas— que soy el copropietario de MartinaCocina, un local que no sé si clasificar como cafetería o restaurante, en el centro de Madrid. En él hemos celebrado, incluso, algún evento del interés de mis lectores.

Ni-nis y estados transitorios

Imaginemos un país feliz en el que mucha gente trabaja durante dos años y luego se toma un mes para buscar otro trabajo mejor. ¿Cuál sería su tasa de paro? Del 4 %: la gente pasaría en el paro uno de cada 25 meses. Ese estado transitorio de un mes se manifestaría así en la EPA de dicho país, como un stock de desempleados.

Descrita como flujo, la situación parecería propicia. Descrita como stock, habría quien le pusiera pegas.

Facetas para entender, tal vez, la evolución del paro

La verdad, no sé de dónde los sacan porque la EPA es trimestral. Pero el INE publica datos mensuales de la tasa de desempleo y las cuelga de una de esas URLs que tienen pinta de cambiar con cualquier soplo (es decir, aviso de que en cualquier momento el enlace deja de funcionar). Por ssi acaso, estos son los datos a día de hoy.

También aparecen publicados regularmente en prensa. Y los expertos opinan sobre si la cifra es buena y o mala. Pero, ¿buena o mala con respecto a qué? Así que hoy voy a ensayar un marco en el que plantear la pregunta:

Demasiado bueno para ser cierto

O el porqué de la importancia de los outliers.

outlier1

Hace unos días me presentaron unos datos. Demasiado buenos para ser ciertos. Casi seguro que reflejan un efecto que no es el que se quiere medir. Estaban muy fuera de rango.

Leí los 93 folios del informe de Gotham sobre Gowex. Si algo debió llamar la atención de esa gente era que la información pública de Gowex estaba plagada de outliers: consistía en una sistemática comparación de ciertas métricas públicas de la empresa con las de sus competidores. Outliers por doquier. El resto de la historia, conocido: ponerse en corto, publicar y hacer dinero.

El primer DataBeers de Madrid, el martes en MartinaCocina

Este martes 6 de mayo tendrá lugar el primer encuentro de DataBeers de Madrid. A las 19:30 de la tarde, en MartinaCocina (plaza de Cascorro, 11), habrá minicharlas relacionadas con el mundo de los datos y cervezas.

mad_data_beers

El programa, que incluye a algunos viejos conocidos, es el siguiente:

Demasiado simple

La realidad es compleja y los más de los fenómenos son multivariados. Frente a casi cualquier afirmación del tipo A causa B, el detector de pendejadas debería hacer saltar la alarma y hacernos pensar que tal vez sea demasiado simple.

Mi detector de pendejadas tuvo más trabajo del habitual mientras leía Equidad y élite. El artículo, tengo la impresión, elabora sobre los datos

pisa_vs_nivel_educativo_padres

recogidos en este informe del Ministerio de Educación sobre los resultados de PISA para España en 2012. En realidad, no son los resultados de PISA sino de un estudio piloto paralelo sobre una submuestra de la muestra de estudiantes a los que se ha examinado por ordenador y no con el tradicional cuestionario de papel. Insisto: tengo la sensación de que son esos los datos porque el autor del artículo no cita sus fuentes sino vagamente.

Menos econometría y más precioestatos

¿Será necesario un doctorado en econometría para poner una lavadora? Con eso ironiza el autor de El nuevo sistema de precios para la electricidad (I): Entre la tarifa gusiluz y la tarifa batamanta.

Os cuento el contexto.

Al parecer, a partir de cierta fecha no muy remota, el precio de la electricidad en España variará de acuerdo con el precio en el mercado de generación y, por lo tanto, según la hora. Las variaciones podrán ser importantes según el día, el tiempo, etc. De manera que los consumidores no sabrán —salvo que malgasten mucho tiempo consultando algún tipo de servicio de cotizaciones en tiempo real— cuánto les costará poner una lavadora. Y, por lo tanto, tampoco podrán ajustar su consumo al precio. Etc.

Cuatro enlaces: sanidad, correos electrónicos, leyes y errores de programación

El primero es Freer trade in European and Spanish health care services y trata sobre los efectos en el sistema sanitario español de una directiva europea que liberaliza el acceso a los ciudadanos de al unión a los servicios de salud de otros países.

En concreto, el artículo argumenta cómo España podría ser uno de los países más afectados por dos razones:

  1. El flujo de extranjeros que atrae el país.
  2. El diferencial de precios (mucho más baratos en España) que en el extranjero.

Los efectos podrían ser tres:

¿Dónde estoy? ¿Dónde estaré?

Me hace cierta gracia leer España: El éxodo en cifras. Desaparecen 1,7 millones de personas entre los 16 y los 39 años. El artículo razona alrededor de la tabla

donde_estan

y se pregunta a dónde ha ido la gente que está en rojo: la población activa en los tramos de edad de entre los 16 y los 29 años y entre los 30 y los 39. Aquí en Zúrich estoy rodeado de un buen número de los faltantes. Pero hay otras causas que el artículo omite.

¿Qué nos jugamos con la neutralidad en la red?

El título de esta entrada es una pregunta en el sentido estricto del término: no sé qué nos estamos jugando con el anunciado fin de la neutralidad en la red y cómo podría modificar la manera en que consumimos y producimos información. Eso sí, he recopilado una serie de artículos de tirios y troyanos sobre el asunto.

Este, de un economista, está aparentemente en contra de la neutralidad. La red es una infraestructura física con una capacidad dada y es natural —argumenta— que quienes la utilicen entren en un proceso de subasta similar al que funciona para repartir otros bienes finitos (slots aeroportuarios en su ejemplo). Creo que tendría sentido, al menos como planteamiento de partida, pensar que los paquetes asociados a una conversación VoIP tuviesen preferencia sobre los de otros tipos de comunicación en que la cuasisincronía no fuese crítica.

¿A qué distancia está el horizonte?

Hoy voy a proponer un pequeño problema de geometría elemental: averiguar a qué distancia está el horizonte. Por concretar, supongamos que mides, p.e., 175 cm, estás en la orilla del mar y miras hacia el horizonte. A cierta distancia, la curvatura de la tierra (que tiene un radio de 6378 km) oculta lo que está más allá.

¿Cuál es dicha distancia?

Una complicación adicional: ¿a qué distancia dejaría de verse un barco que tiene una altura de 20 m?

La monitorización del consumo eléctrico de los hogares

Una de mis manías más imprácticas es la de consultar el consumo de electricidad en tiempo real de Red Eléctrica Española antes de poner una lavadora. Me gusta hacerlo en los valles de consumo; o cuando para hacer circular electrones por cables de cobre contribuye menos a calentar el planeta. Aunque eso resulte en ruidos a deshora.

Una de las manías más imprácticas de las compañías eléctricas, estimo, es la de monitorizar el consumo de los hogares en tiempo real. Es decir, instalar contadores que informan del consumo cada cinco, diez o quince minutos. Conozco gente que trabaja (o intenta trabajar) en ese ámbito y me cuenta historias de horror sobre las ingentes (uso cursivas con fines sarcásticos) cantidades de datos con que esta moda castiga los servidores de las eléctricas.

AVE vs. TGV (o la intensidad de uso del capital ferroviario fijo)

Hoy he recibido el siguiente tuit:

Entrar en http://t.co/RTKy5Ww4GN buscar Geneve-Lausanne, elegir el primer trayecto, mirar el mapa. Ver trenes en movimiento. cc @Egocrata

— Alvaro (@alvarord) September 2, 2013

Siguiendo las instrucciones indicadas, he llegado a un mapa de los derredores de Ginebra en el que se ven los trenes en movimiento (en tiempo real).

¿Existe tal cosa en España? Pues sí, usando el zoom del mapa y arrastrando convenientemente, uno puede llegar a ver el estado de la línea Madrid-Zaragoza: