Sobre la curva ROC como medida de bondad de clasificadores

Esta entrada se entiende mal sin esta otra donde se daba noticia de un clasificador que era mucho mejor o peor (de acuerdo con ciertas métricas) según la tasa de prevalencia de la clase relevante a pesar de que tanto su sensibilidad como su especificidad no eran particularmente malas. Efectivamente, con lo del coronavirus hemos reaprendido a darle la vuelta a las probabilidades condicionales y aplicar el teorema de Bayes para ver qué cabía esperar de un clasificador cuyas bondades se predican en términos de la sensibilidad y la especificidad.

Pero, esencialmente, eso es lo que hace la curva ROC (y sus medidas derivadas, como el área bajo la curva): caracterizar la bondad de un modelo de acuerdo con su sensibilidad y especificidad. Así que los mimos motivos por los que no nos pareció suficiente con el coronavirus siguen vigentes para que tampoco nos lo parezca para cualquier otro fin.