Causalidad

Arranco con un experimento mental: A lleva un chaleco antibalas. B le dispara, la bala atraviesa el chaleco y lo hiere de gravedad en el pecho. Varios sujetos distintos examinan lo sucedido:

La policía determina que B (y el disparo que realiza) es la causa de lo sucedido.
Los médicos que reciben a A en el hospital encuentran que la bala incrustada en su pecho es la causa de su estado.
El técnico de la empresa que fabrica los chalecos antibalas especula que el inusual calibre de la bala y el ángulo de impacto son la causa de que atravesase el chaleco.
Incluso, uno puede especular que gente que conoce a B (p.e., su siquiatra, su familia o sus amigos íntimos) aventuren otras causas para lo sucedido.

En el mundo, realmente, ha sucedido lo que ha sucedido y nada más: hay, a lo más, razones. La razón de que A se debata entre la vida y la muerte es que tiene una bala en el pecho. Pero determinados sujetos identifican causas que los apelan en tanto que son lo que son y que los mueven a la acción: unos a detener e interrogar a B, otros a intubar a B, etc.

I.

Tiene Andrew Gelman una entrada en su blog, Rubinism: separating the causal model from the Bayesian data analysis, que es, según se mire, relevante o trivial. Esencialmente distingue entre el RCM (modelo causal de Rubin) y el análisis bayesiano (de datos):

El RCM (o modelo de los efectos potenciales en inferencia causal) lo resume como un modelo en el que se entiende que los datos proceden de una muestra en la que, en el mejor de los casos, se ha visto el efecto de un tratamiento dado en cada sujeto.
El análisis bayesiano como un marco más amplio que puede servir para analizar el RCM (aunque hay alternativas) o para otras cuestiones.

A todo esto, el RCM se llama también modelo de Neyman-Rubin. Neyman (el de los intervalos de confianza) introdujo una versión limitada del modelo en su tesis de maestría de 1923 y muchos años después, en los 70, Donald Rubin lo extendió y generalizó en una serie de artículos como este.

Scott Sumner escribe aquí:

La causalidad es un concepto ambiguo que depende de qué contrafácticos son los más útiles. Por lo tanto, se podría decir que la deflación de China está causada por un yuan sobrevaluado. O se podría decir que, asumiendo un valor fijo del yuan, la deflación es causada por malas políticas del lado de la oferta. Ambas afirmaciones son defendibles. La pregunta es: ¿qué solución es la más factible, la más útil?

Estaba revisando algunos artículos relacionados que tenía guardados sobre el asunto de la causalidad,

todos ellos de la órbita mal llamada racionalista y dos ellos de la pluma de Eliezer Yudkowsky, que dan vueltas alrededor del asunto de la causalidad y que traen dos definiciones distintas (e incompatibles) de la cosa.

En efecto, la primera definición discute la causalidad en términos de cosas que hacen que sucedan otras cosas. En tal caso, la causalidad estaría en el mundo, sería objetiva y pertenecería al ámbito de las cosas. La segunda dice que hay causalidad ahí donde un sujeto, un verbo y un objeto. En el tercer párrafo del tercero de los artículos citados más arriba pueden verse las dos, una al lado de la otra, como si fuesen una misma cosa o se implicasen mutuamente de manera tan obvia que no exige siquiera demostración. Pero ahí donde hay un sujeto, un verbo y un objeto tiene que haber necesariamente alguien que los piensa y los escribe o pronuncia. De acuerdo con la segunda forma de entender la causalidad, esta dependería del punto de vista.

Lo más satisfactorio de la entrada Resolving disputes between J. Pearl and D. Rubin on causal inference es constatar cómo el autor, Andrew Gelman, también encuentra opacos conceptos muy pearlianos como el de collider of an M-structure.

La entrada de NadaEsGratis en cuestión se titula Consumo de alcohol entre los adolescentes y rendimiento educativo. Por dónde y cuándo se ha publicado, sabemos sin leerla que va a encontrar una relación negativa entre ambos. Pero el estudio está plagado de problemas (el uso de proxies, efectos pequeños, la gran cantidad de ruido, la falacia ecológica, etc.), cualquiera de los cuales hemos visto por sí solos poner en cuestión otros resultados en otras partes. Afortunadamente para el autor, como solo busca probar que la hierba es verde y que al agua moja, es muy probable que nadie lo cuestione con el manual de metodología en mano.

Bajo cierto punto de vista, el estudio estadístico de la causalidad viene a consistir en la estimación de modelos incompletos. Un modelo completo es uno que contiene todas las ecuaciones / relaciones causales que afectan a un fenómeno. En uno incompleto, las variables y ecuaciones faltantes introducen sesgos de distinta naturaleza. Uno de los sitios donde mejor lo he visto contar es en Simulating confounders, colliders and mediators, de donde extraigo, además, el siguiente gráfico:

Introducción

He estado pesando durante las vacaciones sobre el asunto de la causalidad y su naturaleza. He llegado a la conclusión que resumo en esta entrada. Es posible que esté en contradicción con otras cosas que haya escrito o dicho previamente sobre el asunto. Quedan corregidas —enmendadas o deprecadas— por la presente.

Al hablar de causalidad hoy aquí no me refiero al problema, relacionado pero distinto, de medir el efecto de determinadas intervenciones y las dificultades que eso entraña. Me refiero a lo que la causalidad propiamente es —si se quiere, en términos filosóficos—.

En muchos sitios se habla sobre cómo A causa B —o tiene un efecto de cierto tamaño sobre B—. Mucho menos se suele hablar de la forma de ese efecto. El siguiente gráfico (extraído de aquí) muestra ocho de las infinitas formas en que una variable puede tener un efecto sobre otra:

En todas ellas, el efecto global tiene el mismo valor medio.

Los corolarios los dejo para cada cual.

I.

Voy a retomar un hilo perdido en mi discusión del otro día sobre la falacia ecológica para abundar en una cuestión que tiende a obviarse a pesar de su gran importancia.

En aquella entrada fusilé/usufructé el siguiente gráfico:

En él se representan individuos (las elipses de colores) sobre los que hay medidas repetidas (las nubes de puntos que contienen) de cierto fenómeno cuantitativo. Lo relevante del gráfico es que:

Esta entrada trata sobre la causalidad; en particular, sobre que sobre ella nos enseña el artículo ¿Cómo reaccionan los individuos a los impuestos sobre ingresos “caídos del cielo”?. Aunque antes de llegar al meollo del asunto, me voy a permitir un par de digresiones.

I.

El artículo fue publicado en NadaEsGratis, un blog de economía que ha conocido dos fases distintas y que son ambas interesantes por motivos casi opuestos:

La fase excepcional, durante la que escribían en él grandes economistas que inspiraban a sus lectores y ampliaban su visión del mundo.
La fase regular, en la que su lectura revela no es otra cosa que las miserias de la disciplina tal cual da la impresión de profesarse en España. Informa ya no tanto sobre el mundo sino sobre los pretendidos informantes.

De esas cuestiones traté una vez superficialmente aquí.

Causalidad

Sobre los aspectos apelativos de la causalidad

Varios asuntos relacionados con la causalidad

I.

Causalidad, utilidad y teoría de la decisión

Dizque "allí donde hay un objeto, un verbo y un sujeto, hay causalidad"

Varios apuntes sobre causalidad

Algunos apuntes sueltos sobre causalidad

Causalidad

Introducción

¿De qué "forma" es que A causa B?

Aún más sobre la falacia ecológica

I.

Causalidad en el EuroMedioMillón

I.