Estadística

La varianza y cifras macroeconómicas

De la pobre varianza solo se acuerdan los vándalos: el historial de su página en la Wikipedia refleja la incesante actividad de unos cuantos desaprensivos empeñados en sustituir su definición o propiedades por declaraciones de amor perpetuo a sus novias circunstanciales u otras lindezas.

De la varianza se acuerdan los vándalos, pero es ignorada por políticos, periodistas y quién sabe si también economistas. Ni aun estoy seguro de que de ella se acuerde el INE. El hecho es que las cifras macroeconómicas que se publican periódicamente (desempleo, crecimiento del PIB, etc.) nos son dadas como si de verdades reveladas se tratase y sin el muy conveniente aderezo de algún tipo de medida de su nivel de fiabilidad (varianza o similar). Luego, a toro pasado (en ocasiones, a toro lidiado, cocido en caldereta, comido, digerido con café, copa y puro y defecado), aparecen revisiones de las que ya nadie da cuenta. En fin.

La fábula del tendero, la báscula y la caneca (y su desasosegadora moraleja)

Érase una vez un tendero tan con los sesos hechos agua de la desordenada lectura de divulgación científica soviética que, émulo de su autor favorito, decidió diseñar su propio experimento de física recreativa.

Así, armado de su nueva y flamante báscula, decidió comprobar si un litro de agua pesaba más de medio kilo. Y, efectivamente, el resultado de su experimento fue el esperado.

Animado por el éxito, se aventuró a realizar otro: comprobar si dos litros de agua pesaban, de nuevo, más de medio kilo. Habrá quien piense que se trata de un experimento ocioso (habida cuenta del resultado del primero). No obstante, el tendero realizó el experimento y, oh sorpresa, ¡resultó que dos litros de agua pesaban menos de medio kilo!

¿Sabes estadística? ¿Quieres ganar 100K dólares? Pues lee...

Después del éxito de crítica y público de la competición de Netflix, están apareciendo iniciativas similares. De hecho, acabo de recibir noticia de una más en la que se busca a una persona o equipo capaz de aportar ideas novedosas para el análisis de un conjunto de datos grande. Y se ofrece, además, una recompensa de 100k dólares para el ganador.

¿Interesante para algún proyecto de tesis/tesina? ¿O como proyecto colectivo en algún curso de minería de datos?

Creando paquetes con R: r-forge

Hace poco no asistí a una conferencia del profesor Campo Elías Pardo en la Universidad Nacional de Colombia sobre la creación de paquetes de R. Me pesó no poder asistir porque sospeché primero y corroboré después que se había obviado en ella una herramienta muy útil para la creación de paquetes con R: la forja oficial.

La conferencia trataba esencialmente sobre cómo crear paquetes bajo Windows. Windows es un sistema operativo del que sé poco y siempre me han parecido excesivamente arcanas las liturgias y herramientas necesarias para compilar los paquetes. Especialmente cuando uno cuenta con Linux. Pero ésa es otra historia.

febRero

Nada he publicado durante el mes de febrero en el blog. Pareciese que no estaba en el mundo. Estaba, sí, pero en otra parte, muy hermosa, de él. Y de parte de mis hechos da cuenta el siguiente afiche:

conferencia alrededores medellín

Como en él indica, en el Departamento de Estadística de la Universidad Nacional de Medellín tuvieron la gentileza de invitarme a dar de nuevo la conferencia que impartí en las I Jornadas de Usuarios de R en España. Tuve ocasión de conocer al (y tomarme un tintico con) legendario Juan Carlos Correa, del que supe más tarde que me calificó de gomoso de R.

Excel y estadística

Un buen amigo me comentó que un truco que usaba para incrementar las visitas a su blog era hablar de Excel. Como todavía no he tenido ninguna, con su venia, tomaré prestada la idea. Por otra parte, siendo este un blog dedicado a la estadística, la minería de datos y asuntos concomitantes, enumeraré motivos por los que, en dichos ámbitos, se desaconseja su uso.

Los enlaces son ajenos, en inglés, y, algunos, algo viejos (hacen referencias a versiones antiguas de Excel). Van ahí: