Sesgo, calibración y variabilidad
Tenemos una población con dos grupos, 50% de cada. Por simplificar, nuestra población son monedas que son de dos tipos: A, con probabilidad de cara del 25%. B, con probabilidad de cara del 75%. Construimos un modelo que predice siempre 50%. Entonces: El modelo está bien calibrado: para aquellos para los que el modelo predice el 50% (que son todos), la probabilidad promedio de cara es del 50%. El modelo tiene sesgo: si nos fijamos en los A, el modelo sobreestima; si nos fijamos en los B, infraestima. El problema es la (falta de) variabilidad. ...