Más sobre correlaciones espurias y más sobre correlación y causalidad
Hoy toca esto:
Esto es lo que provoca la contaminación: los picos de contaminación coinciden con un aumento radical en los ingresos de los hospitales https://t.co/GpEBg6hqko pic.twitter.com/tvwS1r3Ldi
— Ignacio Escolar (@iescolar) November 23, 2017
Se trata de una invitación para leer el artículo Los picos de contaminación coinciden con un aumento radical en los ingresos hospitalarios, un cúmulo de desafueros epilogados por el ya habitual
En primer lugar y antes de nada, me es obligado felicitar a los dos autores del estudio: desde el sector privado, sin ningún tipo de subvención pública y con coste cero para el contribuyente, han llegado a la misma conclusión que un señor, este, que, aparte de omitir la coletilla anterior en sus artículos, nos cuesta a todos un chorro de euros cada mes.
El artículo es un sindiós, un catálogo completo de lo que no hay que hacer y trivialmente falsable. Trata de establecer una correlación, que el director del periódico eleva relación de causalidad, entre contaminación e ingresos hospitalarios urgentes por enfermedades respiratorias.
Pero digresemos sobre fuentes de correlación.
Una es la causalidad. Si hay causalidad, hay correlación. Bien.
Otra es la casualidad. V.g.,
Internet está lleno de ejemplos. Basta con buscar “correlation isn’t causation” o jugar un poco con Google Correlate para convencerse de ello.
Existe una tercera que consiste en jugar con los gráficos, sus escalas, etc. para crear apariencias de casi cualquier cosa. Hay ejemplos aquí o aquí.
La cuarta es más enjundiosa. Y nada como un diagrama para sintetizarla:
El gráfico anterior explora tres posibles circunstancias en las que pueden aparecer correlaciones entre dos variables (enfermedad y exposición). La primera, la más trivial y a la que se atiene el artículo, es la causal. La última es menos relevante para lo que traemos entre manos. La fundamental es la de en medio: existe una causa común que modula tanto la exposición como la enfermedad.
En este caso, esa causa común es el invierno. El invierno favorece la fijación de los contaminantes a ras de suelo. El invierno afecta a la gente con enfermedades respiratorias incluso donde la contaminación no es apreciable. Fin.
Es posible que alguien piense (es encomiable) que los dos efectos se suman y pretenda deslindar el uno del otro. Tendrá que tener muy buena suerte para poder distinguir el primero y muy fuerte (el del frío) de otro mucho menor que está además condicionado por una variable, la exposición a la contaminación, que es imposible de medir decentemente. Es algo solo es abordable con dinero de los demás.
En definitiva, existen disciplinas enteras (véase esto y esto) que estudian estas cuestiones y con cuyos rudimentos conviene familiarizarse antes de pontificar.
Y ya.