Causalidad

Algunos apuntes sueltos sobre causalidad

Bajo cierto punto de vista, el estudio estadístico de la causalidad viene a consistir en la estimación de modelos incompletos. Un modelo completo es uno que contiene todas las ecuaciones / relaciones causales que afectan a un fenómeno. En uno incompleto, las variables y ecuaciones faltantes introducen sesgos de distinta naturaleza. Uno de los sitios donde mejor lo he visto contar es en Simulating confounders, colliders and mediators, de donde extraigo, además, el siguiente gráfico:

Causalidad

Introducción

He estado pesando durante las vacaciones sobre el asunto de la causalidad y su naturaleza. He llegado a la conclusión que resumo en esta entrada. Es posible que esté en contradicción con otras cosas que haya escrito o dicho previamente sobre el asunto. Quedan corregidas —enmendadas o deprecadas— por la presente.

Al hablar de causalidad hoy aquí no me refiero al problema, relacionado pero distinto, de medir el efecto de determinadas intervenciones y las dificultades que eso entraña. Me refiero a lo que la causalidad propiamente es —si se quiere, en términos filosóficos—.

¿De qué "forma" es que A causa B?

En muchos sitios se habla sobre cómo A causa B —o tiene un efecto de cierto tamaño sobre B—. Mucho menos se suele hablar de la forma de ese efecto. El siguiente gráfico (extraído de aquí) muestra ocho de las infinitas formas en que una variable puede tener un efecto sobre otra:

En todas ellas, el efecto global tiene el mismo valor medio.

Los corolarios los dejo para cada cual.

Aún más sobre la falacia ecológica

I.

Voy a retomar un hilo perdido en mi discusión del otro día sobre la falacia ecológica para abundar en una cuestión que tiende a obviarse a pesar de su gran importancia.

En aquella entrada fusilé/usufructé el siguiente gráfico:

En él se representan individuos (las elipses de colores) sobre los que hay medidas repetidas (las nubes de puntos que contienen) de cierto fenómeno cuantitativo. Lo relevante del gráfico es que:

Causalidad en el EuroMedioMillón

Esta entrada trata sobre la causalidad; en particular, sobre que sobre ella nos enseña el artículo ¿Cómo reaccionan los individuos a los impuestos sobre ingresos “caídos del cielo”?. Aunque antes de llegar al meollo del asunto, me voy a permitir un par de digresiones.

I.

El artículo fue publicado en NadaEsGratis, un blog de economía que ha conocido dos fases distintas y que son ambas interesantes por motivos casi opuestos:

  • La fase excepcional, durante la que escribían en él grandes economistas que inspiraban a sus lectores y ampliaban su visión del mundo.
  • La fase regular, en la que su lectura revela no es otra cosa que las miserias de la disciplina tal cual da la impresión de profesarse en España. Informa ya no tanto sobre el mundo sino sobre los pretendidos informantes.

De esas cuestiones traté una vez superficialmente aquí.

Causalidad: un (otro) ejemplo de libro

A pesar de lo intrincados que resultan muchos de los diagramas causales que aparecen en los textos, en la práctica abundan las cuestiones y los estudios alrededor de sus formulaciones más simples, es decir, la representada por

Este gráfico se resumen varios posibles escenarios:

  • A causa B.
  • Tanto A como B están causados por un tercer factor C.
  • O, incluso, una mezcla de los dos anteriores.

Las discusiones alrededor de estos diagramas puede ser bizantina (y, generalmente, lo es), debido principalmente al interés que tienen tirios o troyanos en poner en marcha las acciones que parecen controlar el proceso según se dé importancia a unos u otros factores.

¿Se encoge el cerebro de los hombres cuando tienen un su primer crío?

Si uno atiende a lo que dicen los medios, diríase que sí. El runrún mediático está motivado por la publicación del estudio First-time fathers show longitudinal gray matter cortical volume reductions: evidence from two international samples al que no tengo acceso ni siquiera oblicuamente (i.e., vía Sci-Hub), pero cuyo resumen traduce ChatGPT así:

Las evidencias emergentes señalan la transición a la paternidad como una ventana crítica para la plasticidad neural en adultos. Estudiar a los padres brinda una oportunidad única para explorar cómo la experiencia de la paternidad puede dar forma al cerebro humano cuando el embarazo no se experimenta directamente. Sin embargo, muy pocos estudios han examinado las adaptaciones neuroanatómicas de los hombres que pasan a la paternidad. El presente estudio informa sobre una colaboración internacional entre dos laboratorios, uno en España y otro en California (Estados Unidos), que han recopilado prospectivamente datos de neuroimagen estructural en 20 futuros padres antes y después del nacimiento de su primer hijo. La muestra española también incluyó un grupo de control de 17 hombres sin hijos. Probamos si la transición a la paternidad implicaba cambios anatómicos en el volumen, grosor y área cortical cerebral, y en los volúmenes subcorticales. Encontramos tendencias superpuestas de reducción del volumen cortical dentro de la red de modo predeterminado y las redes visuales, y la preservación de las estructuras subcorticales en ambas muestras de padres primerizos, lo cual persistió después de controlar la edad de los padres y los niños en la exploración postnatal. Este estudio proporciona evidencia convergente de cambios estructurales corticales en los padres, respaldando la posibilidad de que la transición a la paternidad pueda representar una ventana significativa de plasticidad neuroestructural inducida por la experiencia en los hombres.

Villaverde, Carabanchel, Puente de Vallecas, Tetuán, Ciudad Lineal, Usera, Villa de Vallecas, Latina, San Blas-Canillejas, Hortaleza, Moratalaz, Vicálvaro, Retiro, Fuencarral-El Pardo, Arganzuela, Moncloa-Aravaca, Chamartín, Barajas, Centro, Chamberí, Salamanca

La anterior es una lista de los 21 distritos del municipio de Madrid en un orden muy concreto. Si se te ocurre alguno, casi seguro, te has equivocado.

Porque se trata de una lista en estricto orden de porcentaje de colegios públicos de primaria (CEIP) que ofrecen clases en modalidad de jornada continua:

Los datos completos pueden consultarse aquí. Las fuentes son el CISF para el numerador y el buscador de colegios de la Comunidad de Madrid para el denominador.

La paradoja de Lord, de nuevo

Escribí sobre la paradoja de Lord en 2013 y luego otra vez, tangencialmente, en 2020. Hace poco releí el artículo de Pearl sobre el tema y comoquiera que su visión sobre el asunto es muy distinta de la mía, voy a tratar de desarrollarla.

Aunque supongo que es generalizable, la llamada paradoja de Lord se formuló inicialmente al estudiar y comparar datos antes/después. En su descripción original de mediados de los 60, había niños y niñas a los que se había pesado en junio y en septiembre. El problema (y la paradoja) aparecían al tratar de modelar esa variación de peso según el sexo.

"Generalized random forests": una introducción

Los generalized random forests (GRF en lo sucesivo) han cobrado cierta relevancia recientemente porque una de sus potenciales variantes son los llamados causal forests: RRFF adaptados para medir el tamaño de una intervención causal.

Lo que voy a contar aquí es un resumen de lo que aprendí echándole un vistazo al artículo relevante de la cosa.

[Nota: voy a simplificar un poco con respecto a lo que aparecen en el artículo por aligerar la introducción; recuérdese: este es un mapa del territorio y el territorio en sí mismo.]

Causalidad e individualismo metodológico

Frecuentemente, se postulan y estudian relaciones causales del tipo

donde, por simplificar, se han eliminado las variables de confusión, etc. para mostrar su versión más estilizada, la que acaba en los abstracts.

Frecuentemente, además, $C$ y $E$ hacen referencia a magnitudes macro: una campaña de publicidad y los ingresos; una medida económica y el PIB; la presión y el volumen de un gas, etc. Todos sabemos que en esos casos, el diagrama anterior es solo una manera abreviada de representar el verdadero diagrama causal,

¿Por qué no funcionan las intervenciones buenistas?

El otro día, en mi entrada sobre la estadística en las ciencias blandengues, me cité el ensayo Nothing Scales del que extraje el parrafito

But trying to analyze this is very rare, which is a disaster for social science research. Good empirical social science almost always focuses on estimating a causal relationship: what is β in Y = α + βX + ϵ? But these relationships are all over the place: there is no underlying β to be estimated! Let’s ignore nonlinearity for a second, and say we are happy with the best linear approximation to the underlying function. The right answer here still potentially differs for every person, and at every point in time.* Your estimate is just some weighted average of a bunch of unit-specific βs, even if you avoid randomized experiments and run some other causal inference approach on the entire population.

Un experimento físico (y su relación con la causalidad) (II)

En esta entrada es continuación y discusión de la primera de la serie. En esta se va a discutir su relevancia en la discusión sobre lo que es la causalidad más allá de las técnicas que puedan existir para identificar y medir el tamaño de los efectos una vez que la causalidad está postulada.

Comenzaré haciendo notar una obviedad: el concepto de causalidad es ajeno a las matemáticas. Los hechos matemáticos no tienen causas sino razones o explicaciones. Que los catetos de un triángulo rectángulo midan 3 y 4 no es la causa de que su hipotenusa mida 5, sino su razón.