Tolstoi, sobre los mercados ineficientes

Arranca Tolstoi en Ana Karenina con esta frase mítica: Todas las familias felices se parecen entre sí; las infelices son desgraciadas en su propia manera. Me recuerda mucho a la contraposición entre la probabilidad que estudié en la universidad y la que regía fuera. Dentro, mis variables eran, casi indefectivamente, iid, es decir, independientes e idénticamente distribuidas. Y las variables independientes son muy parecidas entre sí. Incluso más, diría yo, que las familias felices. ...

30 de marzo de 2012 · Carlos J. Gil Bellosta

Otra de huelgas

Hoy, por motivos evidentes, e igual que en septiembre de 2010, voy a hablar de huelgas. De la misma fuente que entonces he descargado este fichero. Y he ejecutado library(pxR) library(reshape) library(ggplot2) dat <- read.px("pcaxis-623612450.px") dat <- as.data.frame(dat) dat.mes <- cast(dat, Periodo ~ series) colnames(dat.mes) <- c("mes", "n.huelgas", "n.trabajadores", "n.jornadas") p <- ggplot(data = dat.mes) + geom_line(aes(x = mes, y = n.huelgas, group = rep(1, nrow(dat)))) p ggsave("huelgas_por_mes.png") dat.anno <- dat tmp <- strsplit(as.character(dat.anno$Periodo), "M") dat.anno$Periodo <- sapply(tmp, function(x) x[1]) dat.anno <- cast(dat.anno, Periodo ~ series, fun.aggregate = sum) colnames(dat.anno) <- c("anno", "n.huelgas", "n.trabajadores", "n.jornadas") p <- ggplot(data = dat.anno, aes(x = anno, y = n.huelgas, group = rep(1, nrow(dat.anno)))) + geom_line() p <- p + geom_point(aes(size = n.jornadas)) p <- p + scale_x_discrete("año") + scale_y_continuous("número de huelgas") p ggsave("huelgas_por_anno.png") p <- ggplot(data = dat.anno, aes(x = anno, y = n.trabajadores/n.huelgas, group = rep(1, nrow(dat.anno)))) + geom_line() p <- p + scale_x_discrete("año") + scale_y_continuous("número de trabajadores por huelga") p ggsave("trabajadores_huelga_por_anno.png") p <- ggplot(data = dat.anno, aes(x = anno, y = n.jornadas /n.huelgas, group = rep(1, nrow(dat.anno)))) + geom_line() p <- p + scale_x_discrete("año") + scale_y_continuous("número de jornadas por huelga") p ggsave("jornadas_huelga_anno.png") para obtener, por un lado, el número de huelgas por mes desde enero de 1995 a noviembre de 2011: ...

29 de marzo de 2012 · Carlos J. Gil Bellosta

Contrafactualidad radial

Leí estas navidades un libro sumamente recomendable, España, capital París, de Germà Bel. Su tesis ha vuelto a ser glosada recientemente por César Molinas dentro de una serie de artículos, igualmente recomendables, en El País. La tesis explícita de este libro es simple y documentalmente incuestionable: que la red de infraestructuras españolas fue diseñada al servicio de una visión esencialmente administrativa de España, con Madrid en su centro, y al margen de las necesidades de la economía. Como consecuencia, las regiones económicamente más dinámicas quedaron relegadas, se crearon graves ineficiencias y se incurríó en severos costes de oportunidad. Todo por servir al funcionariado, a una cierta visión de la realidad nacional y al que tan acertadamente retrata Molinas como capitalismo de palco del Bernabéu. ...

28 de marzo de 2012 · Carlos J. Gil Bellosta

Acceso y reutilización de datos públicos

Las leyes son un carajal. Últimamente he tenido que enfrentarme a algunas y me doy cuenta de que es un error que los abogados (y los legisladores) no hayan seguido nunca un buen curso de geometría euclídea. Pongo un ejemplo. La Constitución Española (artículo 22) dice que las asociaciones deberán inscribirse en un registro a los solos efectos de publicidad. Pues bien, parece ser que una asociación, y nos ocurrió con la Comunidad R Hispano no es legal (para poder abrir una cuenta corriente, por ejemplo) de no inscribirse en el registro. ¿Pero no era a los solos efectos de publicidad? ¿Son lo mismo publicidad y legalidad? ...

27 de marzo de 2012 · Carlos J. Gil Bellosta

2013, año internacional de la estadística

En 2013 celebraremos el Año Internacional de la Estadística. Diversas organizaciones estadísticas, entre las que no veo al INE, se han unido para dar a conocer “la importancia de la estadística en la comunidad científica, el mundo de los negocios, la administración pública, los medios de comunicación, las empresas, los estudiantes y el público en general”. Pueden consultarse las actividades programadas y la lista de organizaciones patrocinadoras, a la que es posible que se sume la Comunidad R Hispano.

26 de marzo de 2012 · Carlos J. Gil Bellosta

R y la distribución de Rayleigh

En la reunión de usuarios de R de Madrid de ayer, Carlos Ortega estudió la distribución en el tiempo del número de bugs que aparecen en el código de R en cada versión. Indicó que es plausible que sigan una distribución de Rayleigh, relativamente frecuente en ese tipo de contextos. E indicó que esta distribución, no tan conocida, tiene que ver (he olvidado lo que dijo exactamente) con dos normales independientes. Efectivamente, según la Wikipedia, la distribución de Rayleigh (de parámetro $\sigma$)admite la caracterización ...

23 de marzo de 2012 · Carlos J. Gil Bellosta

Noticia de la primera reunión del grupo de usuarios de R de Madrid

Acaba de terminar la primera reunión del grupo de usuarios de R de Madrid. No hemos disfrutado de la más primaveral de las tardes. Y la ubicación era un tanto excéntrica. Pero hemos tenido tres charlas muy interesantes (y luego, la mía, claro), nueve asistentes (¡espero haber contado bien!) y, sobre todo, unos intercambio de ideas sumamente provechosos. Los enlaces a las presentaciones estarán pronto disponibles en la página del grupo. Pero como adelanto: ...

22 de marzo de 2012 · Carlos J. Gil Bellosta

Un articulillo de Tukey

Hoy ando demasiado ocupado para escribir. Y como es posible que alguno de mis lectores no lo esté tanto como para no leer, le dejo un artículo de Tukey (abajo del todo en el enlace anterior) para que conozca al personaje, si no ha tenido el gusto previo, disfrute en cualquier caso y, en todos, sepa de dónde vienen los rootograms que implementa el paquete latticeExtra de R.

21 de marzo de 2012 · Carlos J. Gil Bellosta

Primera reunión del grupo de usuarios de R de Madrid

El miércoles 21 de marzo de 2012, en el aula N-130 del edificio de primer curso (también conocido como Prefabricado) de la facultad de CC. Económicas de la UCM (Somosaguas) tendrá lugar la primera reunión del grupo de usuarios de R de Madrid. Contamos con tres charlas muy interesantes y una mía. Esta última trata de una función que aún no existe sino en forma de bosquejo en mi cabeza. Espero que esté presentable el miércoles. ...

20 de marzo de 2012 · Carlos J. Gil Bellosta

Error de tipo I, error de tipo II y cómo no confundirlos

Mucha gente se hace un lío con los errores de tipo I y II. Para ellos, esta regla nemotécnica: Tipo I, un false: I falsely think hypothesis is true Tipo II, dos falses: I falsely think hypothesis is false

16 de marzo de 2012 · Carlos J. Gil Bellosta