El extraño caso de la media empírica menguante

La distribución lognormal es la exponencial de una distribución normal. Su media, Wikipedia dixit, es $\exp(\mu + \sigma^2 /2)$. Dada una muestra de la distribución lognormal (y supuesto, por simplificar, $\mu=0$), podemos calcular su media y una estimación de su $\sigma$ y calcular $\exp(\sigma^2 /2)$ y uno pensaría que los valores deberían ser similares. Mas pero sin embargo, library(ggplot2) set.seed(123) sigmas <- seq(1, 10, by = 0.1) res <- sapply(sigmas, function(sigma){ a <- exp(rnorm(1e6, 0, sigma)) mean(a) / exp(var(log(a))/2) }) tmp <- data.frame(sigmas = sigmas, medias = res) ggplot(tmp, aes(x = sigmas, y = medias)) + geom_point() + geom_smooth() produce ...

31 de mayo de 2016 · Carlos J. Gil Bellosta

Una revisita a "¿Cuántos peces hay en un lago?"

Hace ya dos años escribí ¿Cuántos peces hay en un lago? La rescato ahora que se ha publicado el paquete multimark de R, que permite realizar los mismos análisis básicos que hice entonces más muchos otros más sofisticados para resolver variantes del problema.

10 de diciembre de 2015 · Carlos J. Gil Bellosta

El índice de birrieza para distribuciones de probabilidad

Pido disculpas por usar birrieza, que no es una palabra que no existe. Si a alguien se le ocurre otro término mejor, que lo sugiera. Pero es que hay distribuciones de probabilidad que son una birria. Y de ellas me voy a ocupar hoy. Pero antes, una digresión breve. Todas las distribuciones de probabilidad, en la práctica, están acotadas. Aunque sea por el número de átomos del universo. ¿Cuál es la importancia de dicha digresión? Que implica que no hay distribución que, en la práctica, se resista el teorema central del límite. ...

25 de junio de 2014 · Carlos J. Gil Bellosta