"Scorings" para evaluar predicciones expresadas en términos de CIs

Ya he escrito bastante sobre scorings y métodos de evaluación de predicciones, particularmente las expresadas en términos probabilísticos. Los casos más habituales de estas últimas son:

el binario, en el que la predicción es una $p \in [0,1]$;
el continuo, en el que la predicción es una distribución de probabilidad.

Pero sucede en ocasiones que el predictor viene expresado por un intervalo de confianza (o varios, con niveles de significancia distintos).

¿Qué scoring se puede aplicar entonces? Pues, por ejemplo, el que se describe en Evaluating epidemic forecasts in an interval format.