Un argumento para usar la normal: la maximización de la entropía
Llegaré a la normal. Antes, algo sobre la entropía. Nos interesa saber y medir el grado de concentración de una distribución. Por ejemplo, si X es una variable aleatoria con función de densidad $f(x)$ y $x_1, \dots, x_n$ es una muestra de X, entonces, la expresión $$ \frac{1}{n} \sum_i f(x_i)$$ da una idea de la concentración vs dispersión de X: Si es grande, muchos de los $x_i$ procederán de lugares donde $f$ es grande; en un caso discreto, que tal vez ayude a mejorar la intuición sobre la cosa, habría muchos valores repetidos. Si es pequeño, muchos de los $x_i$ procederán de puntos de baja probabilidad; en un caso discreto, aparecerían muchos valores $x_i$ diversos y de probabilidad baja. La expresión anterior converge a ...