Un problema: cómo muestrear histogramas con medias. La vía de los trapecios
Me refiero muy impropiamente con histogramas con medias a algo parecido a
que son resúmenes de datos en los que aparecen no solo intervalos sino también las medias correspondientes a los sujetos dentro de esos intervalos.
Si uno quiere hacer cosas con esos datos tiene una vía que consiste en muestrear el histograma. Pero la media en cada intervalo será su punto central, no necesariamente su valor medio conocido.
Por simplificar, supongamos que tenemos datos en el intervalo [0, 1] cuya media es $latex \mu$. ¿Cómo obtener un muestreo razonable de valores en dicho intervalo?
El primer ensayo podría ser muestrear una distribución trapezoidal, i.e.,
Muestrear un trapecio de esas características equivale a muestrear una mezcla de una uniforme y una triangular (con pesos 0.8 y 0.2 en este caso porque el área del triángulo es la quinta parte de la de la región entera).
Como la media de una distribución triangular es 1/3 o 2/3 (dependiendo de si la moda está en 0 o en 1) y la de la uniforme es 0.5, la mezcla, dependiendo de los pesos, solo serviría para los casos en que la media de intervalo estuviese dentro del intervalo [1/3, 2/3].
Para otros casos, otras entradas.