Carlos J. Gil Bellosta

Vaya, vaya, vaya... (Y, ¿hay motivo para retractar?)

Hablé de los suicidios en España y de lo sospechosos que resultaban los números del INE. Ni harto de vino, decía aquí y aquí. Ahora, resulta que alguien ha echado un vistazo en profundidad al asunto. Y eso, que las cifras del INE son bazofia. Y ahora, ¿qué se hará de todos esos artículos que relacionaban crisis con tasas de suicidio (como, p.e., este)? ¿Deberían retractarlos sus autores?

La AEMET ha muerto, ¡larga vida a la NOAA!

El otro día, buscando datos meteorológicos (históricos, por día) de Madrid, reconstaté que la AEMET cobra por el acceso. Están en su derecho. Igual que lo están los que no se duchan y huelen a perrete chico en el metro. Pero los mismos datos se pueden bajar gratis de la NOAA. Así, a la AEMET, que le den; que haga lo que le venga en gana en su soledad detrás de esa pasarela de pago que tan innecesario es atravesar.

La anticonferencia: una idea que me ronda la cabeza

La anticonferencia me ronda la cabeza. No es una conferencia, (de ahí el prefijo), aunque se parezca a ella en lo de reunir a un grupillo de gente interesada en un asunto. No es un jacatón. Los jacatones están, sobre el papel, bien; pero demasiado a menudo su producto se queda ahí, tiene poca (o nula) trayectoria o impacto. ¿Me dejáis que diga que son mayormente intranscendentes? Pero creo que los de rOpenSci dieron en el clavo con su Unconference. Es una reunión similar a un jacatón, pero con un objetivo claro: desarrollar paquetes y extender el universo de herramientas de rOpenSci. ...

Funcionalidades infravaloradas de R: los corchetes

[Ad]Mirad esta pequeña maravilla de código: n <- 100 dat <- data.frame( y = rnorm(100), x = sample(letters[1:3], n, replace = T) ) medias <- tapply(dat$y, dat$x, mean) dat$x.trans <- medias[dat$x] head(dat) El corchete está manifiestamente infravalorado.

Que Magritte me perdone

¿Qué es %>%? ¿Para qué sirve? Hoy he hecho la presentación más sesgada y parcial del operador para neófitos en R: library(magrittr) 8 %>% sin %>% exp exp(sin(8)) (Es que madrugar me pone de mal humor y saca mi más sincero yo de dentro de mí mismo).

Airbnb da en el clavo: ha desarrollado lo que hacía mucha falta

Y no me refiero a lo que quita el sueño a ciertos ayuntamientos retrógrados. Sino a esto. Que es una herramienta corporativa para diseminar internamente información cuantitativa (en forma de cuadernos (de Python), Rmarkdowns y similares). Más info, aquí. Los que me leéis y trabajáis en uno de esos lugares grandotes donde lo cuantitativo viaja por correo en PPTs, ya sabéis que tenéis que proponer ipso facto en esas reuniones que tanto os gustan.

Este también buscaba la precisión donde tal vez menos importaba

Esta no va de prensa sino de una reunión de vecinos. Al terminar, hablo con uno de ellos y me cuenta que siempre se había dedicado a la construcción y que en alguna ocasión tocó la estadística. En particular, en el estudio, relevantísimo, que describo a continuación. En los años 70, como parte de la preparación de las ofertas para construir una incineradora de basura en Madrid, una que se ve que aún existe, le encomendaron la muy estadística tarea de estimar el poder calorífico de la basura de la capital. ...

Dizque al sexto mes... pero ¿y los datos?

He leído esto, que trata de lo distinta que es a la izquierda y a la derecha de la línea roja punteada. La historia contada desde las posterioris basadas en datos difiere de la apriorística (recordad: ideología = priori). En concreto Reconoceréis una aplicación de causalImpact y lo que significa el gráfico está comentado en todas partes. Código y datos, por mor de la reproducibilidad, aquí.

El teorema de Rolle, ¿acientífico?

Si $f$ es una función continua definida en un intervalo cerrado $[a, b]$, y derivable sobre el intervalo abierto $(a, b)$ y $f(a) = f(b)$, entonces existe al menos un punto $c \in (a, b)$ tal que $f’(c) = 0$. Tal es el enunciado del teorema (de Rolle). Que no dice ni dónde está ese punto, ni cómo encontrarlo ni cómo de complicado podría llegar a resultar. Pero es un teorema, con su demostración y todo. ...

Aquellos que ignoran la estadística etcétera

Ayer asistí a una charla sobre errors. Brevemente (porque está estupendamente explicado, motivado y documentado por su autor, al que aprovecho la ocasión para saludar), hace esto: library(errors) valores <- unlist(list(a = 1, b = 2, c = 3)) vars <- c(1, 1, 1) # varianzas de esos datos/medidas sds <- sqrt(vars) # errores x <- valores errors(x) <- sds format(x[1] * sin(x[2])^3, notation = "plus-minus", digits = 3) #[1] "0.75 +/- 1.28" Y nuestro viejo, clásico, manido, infrautilizado, semidesconocido mas no por ello menos querido método delta, ¿para qué existe en lugar de (como elucubraba el filósofo), simplemente, no existir? ¿Para qué otra cosa sino para aprenderlo me levanté yo aquella fría mañana del 94 sino para contemplarlo proyectado de diapositivas manuscritas de acetato? ¿Fue en vano? ...