Voy a constuir unos datos artificiales y un modelo de clasificación binaria,
library(mgcv)
library(ggplot2)
library(pROC)
n <- 10000
dat <- gamSim(1, n=n, dist="binary", scale=.33)
lr.fit <- gam(y ~ s(x0, bs="cr") +
s(x1, bs="cr") + s(x2, bs="cr") +
s(x3, bs="cr"),
family=binomial, data=dat,
method="REML")
y luego (mal hecho: debería hacerlo sobre un conjunto de validación distinto) a obtener las predicciones para las observaciones
res <- data.frame(real = factor(dat$y),
prob = predict(lr.fit, type = "response"))
que
ggplot(res, aes(x=prob, fill=real)) +
geom_density(alpha=.3)
representa así:

Me pregunto si el clasificador construido es bueno. Para lo cual voy a construir la curva ROC con