Interacciones "mecánicas" en regresiones logísticas

En general, dos variables interaccionan cuando el efecto de una cambia al modificarse el nivel de la otra. Un caso particular (aunque notable) de interacción es el habitual en los modelos lineales, generalizados o no. En ellos, al introducir en el modelo términos del tipo x1 * x2, estamos indicando que el coeficiente de la segunda variable, $latex x_2$, es $latex \alpha + \beta x_1$. El efecto de un incremento de una unidad de $latex x_2$ depende entonces de $latex x_1$.

Esas son interacciones conceptuales (la terminología no es mía; luego indicaré de quién). Existen otras, las mecánicas, producto de la no linealidad de modelos tales como la regresión logística. Cosa que ilustraré con un ejemplo en el que no existen interacciones conceptuales por construcción pero sí afloran interacciones mecánicas.

La función

my_prob <- function(x1, x2, a = 0.2, b1 = 1, b2 = -0.5){
  res <- a + b1 * x1 + b2 * x2
  1 / (1 + exp(-res))
}

predice la probabilidad de un modelo logístico (hipotético) en el que la variable objetivo depende de dos variables, x1 y x2 (con los coeficientes que aparecen en el código). Por construcción, no hay interacción.

El código siguiente muestra las diferencias entre la probabilidad estimada al aumentar variar la variable x2 de 2 a 3 a distintos niveles (-1, 2 y 5) de la variable x1.

diff(my_prob(-1, c(2, 3)))
# [1] -0.0507281
diff(my_prob(2, c(2, 3)))
# [1] -0.100337
diff(my_prob(5, c(2, 3)))
# [1] -0.00935299

¡La variación varía! Luego hay interacción (en el sentido general), pese a que no la haya conceptualmente. Porque existe una interacción mecánica.

Más aún, pueden construirse ejemplos en los que exista una interacción positiva entre dos variables pero poder encontrar valores para los que la relación se vuelve negativa (i.e., al incrementar la una, decrece el efecto de la otra).

Ejemplos de lo anterior, referencias, etc. pueden consultarse aquí.