El extraño caso de la media empírica menguante
La distribución lognormal es la exponencial de una distribución normal. Su media, Wikipedia dixit, es $latex \exp(\mu + \sigma^2 /2)$.
Dada una muestra de la distribución lognormal (y supuesto, por simplificar, $latex \mu=0$), podemos calcular
- su media y
- una estimación de su $latex \sigma$ y calcular $latex \exp(\sigma^2 /2)$
y uno pensaría que los valores deberían ser similares. Mas pero sin embargo,
library(ggplot2)
set.seed(123)
sigmas <- seq(1, 10, by = 0.1)
res <- sapply(sigmas, function(sigma){
a <- exp(rnorm(1e6, 0, sigma))
mean(a) / exp(var(log(a))/2)
})
tmp <- data.frame(sigmas = sigmas, medias = res)
ggplot(tmp, aes(x = sigmas, y = medias)) +
geom_point() + geom_smooth()
produce