No sé si visteis el vídeo que colgué el otro día. Trataba el problema de determinar si dos poblaciones
beer <- c(27, 20, 21, 26, 27, 31, 24,
21, 20, 19, 23, 24,
18, 19, 24, 29, 18, 20, 17,
31, 20, 25, 28, 21, 27)
water <- c(21, 22, 15, 12, 21, 16, 19,
15, 22, 24, 19, 23, 13,
22, 20, 24, 18, 20)
Hace unos años, Juanjo Gibaja y yo organizamos un “curso de estadística moderna con R”. Queríamos mostrar en él que otra estadística es posible, que con la ayuda de los ordenadores (¡y de R!) los problemas clásicos de la estadística pueden afrontarse de otra manera. Y que esta manera es más natural y accesible.
Hoy uno de nuestros antiguos alumnos nos ha agradecido que le señalásemos el camino de esos superpoderes:
Uno espera la media de un número suficiente de variables aleatorias razonablemente iid tenga una distribución normal. Uno casi espera siempre obtener ese aburrido histograma cada vez que remuestrea medias. La gente dice que el teorema central del límite rige necesariamente cuando su tamaño muestral es del orden de magnitud del bruto anual de un gerifalte. Etc.
Pero a veces uno tropieza con distribuciones bootstrap tales como