Charla en Visualizar'15: la tríada del análisis de datos

El martes cinco (de mayo de 2015) daré una charla en Medialab Prado dentro del ciclo con el que arranca Visualizar'2015.

Hablaré de la llamada tríada del análisis de datos y sus aplicaciones al contexto y audiencia del evento. Esta tríada es una aplicación de la trifecta de Kayser Fung, que no merece restringirse al ámbito (relevante pero estrecho) en el que él está interesado.

En el enlace anterior, los detalles del evento y de mis muchos y eminentes compañeros de cartel.

APIdays Mediterranea vuelve a Barcelona (la semana que viene)

Los que estéis por allí o tengáis la posibilidad de acudir, sabed: la semana que viene (5, 6 y 7 de mayo de 2015) se celebra una nueva edición de APIdays Mediterránea en Barcelona.

apidays-SAFA_bw

Quienes tengáis pensado acudir, podéis beneficiaros de un 30% de descuento si os registráis desde este enlace.

Participé en la edición de 2013 en Madrid y me duele no poder asistir este año. Entre otras cosas, por esto. Y me displace perdérmelo porque mi nuevo stealth project tiene mucho que ver con APIs…

Una curiosa trasposición legal (hecha, manifiestamente, a malagana)

Nlp, R

El parlamento de la Unión Europea aprueba directivas. Los parlamentos nacionales las trasponen, es decir, las convierten en leyes nacionales (véase el enlace anterior).

No sé hasta qué punto la trasposición tiene que ser literal. La única experiencia seria que tengo es con esta y sus trasposiciones nacionales a España y el RU. Y era notorio cómo cada país, aprovechando las ambigüedades del texto original, arrimaba el ascua a su sardina.

He perdido el rato comparando la ley de reutilización de datos del sector público con la directiva que traspone (los enlaces, debajo). Que se parecen, por cierto, como un huevo a una castaña. En particular, la ley española añade provisiones que no aparecen en la directiva para asegurarse de que las administraciones públicas no se obligan ni comprometen a nada. Por lo que si en lugar de haber ley, no la hubiera, las cosas no cambiarían en absoluto. Pero esa es otra historia.

Petición al INE: deseadme suerte

Acabo de realizar (día 2015-04-27) la siguiente petición (autoexplicativa) al INE:

Estimados señores:

En sus páginas pueden descargarse los “Mapas municipales” para ser utilizados conjuntamente con el programa PC-Axis para visualizar datos estadísticos. Junto con los mapas aparecen unos ficheros, p.e., “Mapas a 01-01-2004.txt” en los que se indica que:

“El usuario no está autorizado a redistribuir estos archivos sin previa autorización del INE, lo que ha aceptado al proceder a su instalación.”

Intervalos de credibilidad para la distribución beta

Tengo un parámetro, la p de una binomial, que supongo distribuido según una beta. Me da igual para el caso si la distribución a priori es o no informativa. Solo digo que la distribución a posteriori es otra beta con parámetros a y b.

Quiero construir un intervalo de credibilidad para p, es decir, encontrar un subintervalo de [0,1]

  • dentro del cual la densidad de la beta sea mayor que fuera y que
  • capture $latex 1-\alpha$ de la probabilidad total.

Gráficamente,

¿13.100 más/menos cuántos parados menos?

¿Cuál es la cifra de variación del número de parados de la que hablan la última EPA y los medios? 13100.

¿Más menos cuánto? Según el INE, el error de muestreo relativo, $latex \sqrt{V(\hat{\sigma}}$ a nivel nacional en términos porcentuales es

error_relativo

Es decir, el intervalo de confianza para la cifra de parados tendría una anchura como de 100k sujetos. Obviamente, eso impide calcular variaciones de un orden de magnitud menor.

Madrid, ¿ciudad inteligente? ¿O tal vez solo un poco menos sorda?

Madrid es la ciudad más inteligente de Europa. Gracias al proyecto MiNT, con un presupuesto de 14 millones, van a ocurrir cosas de lo más futurista:

El sistema permite que cualquier ciudadano o revisor pueda comunicar cualquier incidente en tiempo real desde su propio terminal o teléfono móvil, mediante el envío de una fotografía con su correspondiente información geográfica. De esta manera, la herramienta de análisis INSA recibirá los datos y los pondrá a disposición del Ayuntamiento y de los proveedores para poder solucionarlo, y con el tiempo incluso, adelantarse a las posibles incidencias.

Programa Profesional de Iniciación a R

Del 9 de junio al 9 de julio impartiré un curso de iniciación a R.

Se trata de una versión extendida de mi curso de introducción a R que, como novedad fundamental, pasa de 12 a 30 horas de duración. El programa, sin embargo, es esencialmente el mismo: aquello, todo ello y no más que aquello que de R podría usarse en Endesa, el Banco de Santander, Deloitte o el Ministerio de Sanidad.

¿Si un día faltan 21.63 euros en caja?

Si un día faltan 21.63 euros en caja se cuenta y se recuenta. Se revisan los tiques, se comprueban los pagos con tarjeta, se vuelven a sumar los pagos a proveedores, etc. Hasta que, con suerte, alguien encuentra algo y la diferencia se reduce a, digamos, 3.92 euros. Pero cuando la diferencia es de 2.15… se da por buena sin más.

Cuando el t-test da un p-valor de .058, se revisan los números, se reestudia la carga y manipulación de datos, se replantea si el caso 194 es o no un outlier, etc. Pero si el p-valor es 0.036, nada de eso ocurre. Nadie revisa caso 194. ¡Ni falta que hace!