Sobre la relación entre la dispersión de las probabilidades y el AUC en modelos bien calibrados
Supongamos que estamos construyendo un modelo de clasificación binaria. Supongamos que está bien calibrado, es decir, que cuando predice una probabilidad $p$ de éxito para un sujeto $i$, entonces es cierto que $Y_i \sim \text{Bernoulli(p)}$.
Por otro lado, pensemos en el AUC, que es muchas cosas, pero entre ellas,
$$ AUC=Pr(p_i >p_j | Y_i =1,Y_j =0),$$
es decir la probabilidad de que, tomando dos sujetos al azar, uno positivo, el $i$ y otro negativo, el $j$, $p_i > p_j$.