Nuevo vídeo en YouTube. Segunda entrega sobre causalidad (y, esta vez, datos observacionales)
El vídeo es
y abunda sobre el archiconocido correlación no implica causalidad. El artículo de Chris Anderson que se menciona es_ The End of Theory_.
El vídeo es
y abunda sobre el archiconocido correlación no implica causalidad. El artículo de Chris Anderson que se menciona es_ The End of Theory_.
El argumento del artículo Paraísos Fiscales, Wealth Taxation, and Mobility pivota esencialmente sobre el gráfico
que resultará familiar a muchos lectores de este blog (y, si no, mirad esto). Se trata de un estudio causal de libro en el que se pretende medir el efecto de una política ocurrida en 2010 sobre la línea roja y la línea azul.
La política en cuestión es la reintroducción del impuesto del patrimonio en España en 2010 y las líneas azul y rojas… no está claro. Deberían ser, pretenden ser, el incremento de personas sujetas a dicho impuesto en Madrid (en rojo) y en otras regiones (azul). Los autores lo resumen diciendo que el número de ricos viviendo en Madrid ha subido en 6000 mientras que en el resto de las 16 regiones ha decrecido en una media de 375. Convenientemente, 16 * 375 = 6000.
Acabo de subir a Youtube mi nuevo vídeo,
que es una somerísima introducción a la causalidad según Pearl. De hecho, el vídeo está basado en el epílogo de su libro, Causality, de 2000.
En el vídeo me refiero a dos fuentes de las que anuncio enlaces. Son:
No suelo hacer anuncios de eventos de terceros, pero este puede ser del interés de muchos dado, en particular, el creciente interés por las cuestiones causales. Se trata de una entrevista a Judea Pearl que tendrá lugar el día 2020-11-17 (mañana, a la hora de escribir esto) y que se retransmitirá vía Zoom.
Los detalles para los interesados, aquí.
Addenda: La entrevista ha sido publicada en
[Una entrada más bien especulativa acerca de esbozos de ideas ocurridas durante un paseo vespertino por Madrid y que apunto aquí por no tener una servilleta a mano.]
El artítulo War, Socialism and the Rise of Fascism: An Empirical Exploration me ha hecho volver a reflexionar sobre el asunto de la causalidad (al que, además, debo un apartado en siempre inacabado libro de estadística para los mal llamados científicos de datos).
Voy a guardar el extracto
de The Art of Statitstics para usarlo con la misma malísima baba que su autor en coyunturas tales como esta:
Recordad las sabias palabras de Spiegelhalter: https://t.co/mne7xhMN3W pic.twitter.com/x8YZxiMvgp
— Carlos Gil Bellosta (@gilbellosta) September 30, 2020
Estoy aquí analizando datos para un cliente interesado en estudiar si como consecuencia de uno de esos impuestos modennos con los que las administraciones nos quieren hacer más sanos y robustos. En concreto, le he echado un vistazo a si el impuesto ha encarecido el precio de los productos gravados (sí) y si ha disminuido su demanda (no) usando CausalImpact
y me ha complacido mucho que la salida de summary(model, "report")
sea, literalmente, esta:
Un grupo de estudiantes se examina en horas distintas con exámenes parecidos pero no iguales. Se pretende estudiar si el examen tiene algún efecto sobre la nota final y para eso se hace algo así como
bmod_math <- lm(pcorrect ~ group, data = MathExam)
para obtener una distribución de la nota media por grupo descrita bien
cbind(estimate = coef(bmod_math), confint(bmod_math))
## estimate 2.5% 97.5%
## (Intercept) 57.600184 55.122708 60.07766
## group2 -2.332414 -5.698108 1.03328
o bien, gráficamente, así:
Me refiero a los autores de El impacto de Airbnb en el mercado de vivienda de Barcelona, que a partir de datos puramente observacionales y en un artículo de apenas 1500 palabras, mencionan la causalidad siete veces. Además, escriben joyas como
[N]uestra investigación se basa en un modelo de econometría lineal (y no de econometría espacial) ya que nuestro objetivo principal es hacer un análisis causal robusto.
Ya sabes: si quieres un análisis causal robusto, el modelo lineal (chupatesa, Pearl).
Si hay algo inaprensible, es la causalidad. No la que entiende Maripili, claro, sino esta. Pero vivimos en tiempos de tremendamente polémicas y presuntamente potentísimas y causas eficientes. Verbigracia, la desigualdad… y Madrid Central:
Argumentas en términos causales cuando esperas que te lea Maripili. Entre gente seria solemos hablar más bien de atribución. Lo de la atribución consiste en tratar de repartir un efecto entre posibles causas potenciales. Como típicamente no hay criterio definitivo, en la práctica funciona así:
Esta entrada es una illustración de otra de no hace mucho, Análisis de la discontinuidad + polinomios de grado alto = … Mirad:
Se ha hecho un análisis de la discontinuidad usando parábolas a ambos lados del punto de corte. Y la discontinuidad no es pequeña. Pero me juego un buen cacho de lo que quede de mi reputación a que mucho de ella la explica el puntico de arriba a la izquierda.
Ni imaginar podéis hasta dónde me tiene lo gratuitamente con que muchos dan por hecha una relación causal entre desigualdad (economómica) y cualquier miasma social.
Yo creo que es que pocos leen cosas como estas (muy recomendable). Y sobre todo porque sale gratis mencionar el nombre de la sacrosantísima causalidad en vano. Con el peligro de que tal vez queramos invertir recursos en remediar el problema raíz y nos demos cuenta al conseguirlo de que, oh, no lo era realmente.