Algunos apuntes sueltos sobre causalidad

Bajo cierto punto de vista, el estudio estadístico de la causalidad viene a consistir en la estimación de modelos incompletos. Un modelo completo es uno que contiene todas las ecuaciones / relaciones causales que afectan a un fenómeno. En uno incompleto, las variables y ecuaciones faltantes introducen sesgos de distinta naturaleza. Uno de los sitios donde mejor lo he visto contar es en Simulating confounders, colliders and mediators, de donde extraigo, además, el siguiente gráfico:

De todos modos, el problema de la causalidad no es, en todo caso, puramente estadístico. Entradas como la anterior no van a resolver cuestiones como las que se estudian en The Fundamental Flaws of The Only Meta-Analysis of Social Media Reduction Experiments (And Why It Matters):

Sin embargo, es un desafío establecer si algo sobre las redes sociales en general causa daños a la salud mental, como la depresión y la ansiedad, o si la asociación se debe principalmente a la causalidad inversa (lo que significa que la depresión o la ansiedad es lo que está causando que algunos adolescentes usen las redes sociales con más frecuencia).

Una vez especificado el modelo causal, la medición es sencilla. Pero, ¿hacia a dónde apuntan las flechas?

En Difference-in-differences: What’s the difference?, Gelman discute el manido tema de las DiD, donde sostiene que él prefiere estudiar $(y_T – y_C) – \beta(x_T – x_C)$ —donde $T$ y $C$ representan tratamiento y control directamente y $\beta$ es un coeficiente de regresión estimado a partir de los datos— que el estándar $(y_T – y_C) – (x_T – x_C)$, donde $\beta = 1$ y que es el método de las DiD de libro.

Dos artículos, este y este, en los que se discuten una serie de resultados. Basta con echarles un vistazo a los gráficos que los acompañan, como

o

para darse cuenta rápidamente de que no hay mucho aprovechable en lo que proclaman.

Aquí se lee:

Como estadístico, fui entrenado para considerar los experimentos aleatorizados como el gold standard del conocimiento en las ciencias sociales y, a pesar de haber visto argumentos ocasionales en sentido contrario, sigo manteniendo esa opinión, expresada de manera concisa por Box, Hunter y Hunter: “Para averiguar qué sucede cuando cambias algo, es necesario cambiarlo.”

Sin embargo, como científico social, he publicado muchos artículos de investigación aplicada, casi ninguno de los cuales ha utilizado datos experimentales.

Radiandando es un blog que lleva desde 2017 (su primera entrada es de diciembre de ese año), desmontando bulos, ciencia en mano, sobre los efectos de los campos electromagnéticos de radiofrecuencia en la salud. En su primera entrada ya escribía cómo a día de hoy, a los niveles de exposición habituales, no existe evidencia de que los CEM-RF provoquen efectos sobre la Salud. Siete años después, publica la entrada La ciencia descarta relación entre móviles y cáncer tras casi tres décadas de investigación. El lector circunstancial se preguntará: ¿sobre qué habrá podido estar escribiendo entonces durante los últimos siete años?

Finalmente, Scott Alexander escribe aquí:

Las mayores tasas por frío extremo se dan en el África subsahariana, y es más probable que haya decesos por calor extremo en Groenlandia, Noruega y varias zonas con montañas muy altas. Has leído bien: las muertes por frío se concentran en las áreas más cálidas, y viceversa.

No se puede no leer el resto, ¿verdad?