De A/B a DiD
Un test A/B consiste en (o aspira a) estimar (y tal vez promediar) las diferencias
predict(modelo_t, x) - predict(modelo_c, x)
donde modelo_t
y modelo_c
son modelos construidos en grupos tratados y no tratados de cierta manera.
Entra el tiempo.
Ahora ya no se trata de medir esas diferencias sino las diferencias entre los incrementos antes y después. Que se hace construyendo cuatro modelos para con ellos obtener
(predict(modelo_td, x) - predict(modelo_ta, x)) -
(predict(modelo_cd, x) - predict(modelo_ca, x))
donde los sufijos t
, c
, a
y d
quieren decir tratamiento, control, antes y después. Además, los cuatro modelos suelen ajustarse de una (p.e., usando modelos lineales con interacciones con tiempo y tratamiento para cada variable).
Lo que no me queda claro de todo esto es dónde queda la paradoja de Lord, central en todo este asunto y de las que pocos parecen haber oído hablar alguna vez.