Curso de estadística aplicada con Stan: ejercicio 1
A primeros de julio impartí un curso de estadística bayesiana aplicada con Stan. Tengo que examinar a los alumnos y he aquí el primero de los ejercicios:
En un país, se extrae una muestra de 2000 hombres y mujeres con la siguiente distribución:
men <- 170 + 3 * rt(1000, 6)
women <- 160 + 2 * rt(1000, 5)
heights <- c(men, women)
Ajusta una distribución (una mezcla de dos distribuciones de Student) usando los datos anteriores, i.e., heights
. Puedes suponer conocidos:
- Los pesos de la mezcla (0.5) cada uno.
- Que los grados de libertad de las t’s están entre 3 y 8 aproximadamente.
- Experimenta con otros tamaños muestrales y comenta los resultados obtenidos (y los tiempos de ejecución).
Nota: este problema está motivado por una aplicación real: el ajuste de distribuciones de pérdida en banca y seguros. Típicamente, se mezclan dos distribuciones, una para la cola de la distribución y otra para el cuerpo. Hay técnicas frecuentistas (p.e., EM) para resolver estos problemas. Pero me parecen menos naturales y menos flexibles que la ruta 100% bayesiana.