Los coeficientes de la regresión logística con sobremuestreo
Esta entrada viene a cuento de una pregunta en r-help-es con, por referencia, este contexto:
Tengo un dataset con 4505 observaciones en el que la variable dependiente son presencias (n=97 y clasificadas como 1) y ausencias (n=4408 y clasificadas como 0).
Y la cuestión tiene que ver con la conveniencia de utilizar una muestra equilibrada o no de los datos al ajustar una regresión logística y si procede o no utilizar pesos.