Mala Ciencia

La miseria de la inferencia causal vivida

X escribe en 2020:

In particular, panel A presents the results when the municipalities are divided according to the real average Internet speed (Mbps). As is evident, the effect of extreme-right mayors on hate crimes is concentrated in municipalities where Internet speed is high, especially when the intensive margin is considered […]

Y escribe también en 2020:

Results show that Internet availability between 2008 and 2012 is associated with a better knowledge of (national) immigration dynamics and that it leads to an overall improvement in attitudes towards immigrants.

Sobre la economía conductual

[Esta entrada recoge una serie de notas y reflexiones sobre el asunto del título desgajadas de un proyecto de vídeo que vengo posponiendo varias semanas y que toca el asunto semitangencialmente.]

I.

En muchas disciplinas científicas (y no solo científicas: también, por ejemplo, en la dialéctica de Marx y Engels) existen unos resultados que por algún motivo se conocen tradicionalmente como leyes (p.e., la de la gravitación universal). Haciendo una enumeración rápida de algunas que me saltan a la memoria, constato que ninguna de ellas deja de ser una observación empírica. Al menos, en su origen.

Causalidad y paraísos fiscales

El argumento del artículo Paraísos Fiscales, Wealth Taxation, and Mobility pivota esencialmente sobre el gráfico

que resultará familiar a muchos lectores de este blog (y, si no, mirad esto). Se trata de un estudio causal de libro en el que se pretende medir el efecto de una política ocurrida en 2010 sobre la línea roja y la línea azul.

La política en cuestión es la reintroducción del impuesto del patrimonio en España en 2010 y las líneas azul y rojas… no está claro. Deberían ser, pretenden ser, el incremento de personas sujetas a dicho impuesto en Madrid (en rojo) y en otras regiones (azul). Los autores lo resumen diciendo que el número de ricos viviendo en Madrid ha subido en 6000 mientras que en el resto de las 16 regiones ha decrecido en una media de 375. Convenientemente, 16 * 375 = 6000.

Una nota sobre el artículo "retractado" porque sus autores habían omitido vínculos con la industria del tabaco

Hace unos días se retractó un artículo sobre la relación entre el tabaco y el covid porque los autores habían omitido cierta presunto conflicto de intereses (los detalles, aquí).

He subrayado la palabra porque en el párrafo anterior: es la más relevante de toda la historia.

No mucha gente sabe que el teorema de Pitágoras es simplemente la proposición 47 de los Elementos de Euclides. Ni a Euclides ni a nosotros nos importa en absoluto si Pitágoras tuvo conflicto de intereses alguno con la industria del cartabón ni con el sindicato de agrimensores. La geometría es una de esas disciplinas científicas donde la identidad del sujeto que propone, describe o demuestra proposiciones queda eliminada de la ecuación, se convierte en algo totalmente irrelevante.

Más sobre el mito de la objetividad (especialmente, la "data-driven")

Prometí escribir sobre

y, se conoce, ha llegado el día de hacerlo. Se trata en apariencia de un chiste matemático que, espero, capten todos los lectores de este blog en su sentido más llano.

Todas las facetas del gráfico muestran los mismos puntos. Se trata de una selección magistral de ellos. Tanto que alguien debería paquetizar sus coordenadas y publicarlos. Serían un nuevo iris. Dan, como se ve, mucho juego: cada uno de los ajustes parece razonable, tan bueno como cualquiera de esos que estamos sobradamente acostumbrados a ver en prensa, tanto generalista como especializada.

Sobre el "programa fuerte" de la sociología de la ciencia: una visión desde la "ciencia de datos"

I.

Estos días y por razones que no vienen a cuento, he estado leyendo Fashionable Nonsense. Es un libro que puede describirse como la versión del director del conocido como escándalo Sokal.

Para los no advertidos y según la Wikipedia:

En 1996, Sokal, profesor de física en la Universidad de Nueva York, envió un artículo pseudocientífico para que se publicase en la revista postmoderna de estudios culturales Social Text. Pretendía comprobar que una revista de humanidades «publicará un artículo plagado de sinsentidos, siempre y cuando: a) Suene bien; y b) Apoye los prejuicios ideológicos de los editores (contra las ciencias empíricas)».

¿A que les ha jugado una mala pasada el Excel?

Se ha dado por cabal en muchos medios lo que espero que no llegue a más que a un borrador. Ha sido publicado por el Banco de España y contiene párrafos como

En cambio, la menor cualificación, por término medio, de los trabajos desempeñados por los jóvenes licenciados españoles sugiere que su nivel de desempleo comparativamente mayor que el de sus homólogos del área del euro podría obedecer, entre otros factores, a una menor calidad de la educación superior.

Con un poco de imaginación, la teoría lo aguanta todo

Si no, oigamos a Vitruvio explicándonos todo sobre la cal:

La causa de tomar la cal con el agua y arena tanta unión parece ser, porque las piedras están, como los otros cuerpos, compuestas de los quatro elementos: las que tienen mayor porción de ayre son tiernas; las que tienen mas de agua son suaves por el húmido ; las que mas tierra son duras; y las de mas fuego quebradizas. Si qualesquiera de estas piedras sin cocer se quebrantasen y moliesen, y con arena y agua se hiciese mortero para edificar, ni travaria, ni podría sostener el muro ; pero penetradas del fuego en el horno, pierden lo rígido de su solidez primera; y consumidas y exhaladas sus fuerzas, quedan esponjosas, abiertas y vacías de poro. Extraídos de ellas el agua y ayre, y quedando el fuego, ahogado éste en otra agua antes que se exhale, toma vigor y fuerza, y penetrando el húmido en lo vacío de los poros, se enciende en hervores, hasta que salido todo el calor que tenia antes, se enfria. Esta es la causa de que las piedras después de cocidas pesan menos que antes, aunque queden del mismo volumen; y hecha la prueba, se las halla una tercera parte menos de peso. Ahora pues, teniendo la cal el poro abierto, arrebata á sí la arena que se le mezcla, uniéndose mutuamente; y abrazando después ambas la piedra al secarse, hacen todos un cuerpo, de que resulta la solidez de los edificios.

Socialismo y fascismo en Italia: una reflexión sobre la causalidad y las microcausas

[Una entrada más bien especulativa acerca de esbozos de ideas ocurridas durante un paseo vespertino por Madrid y que apunto aquí por no tener una servilleta a mano.]

El artítulo War, Socialism and the Rise of Fascism: An Empirical Exploration me ha hecho volver a reflexionar sobre el asunto de la causalidad (al que, además, debo un apartado en siempre inacabado libro de estadística para los mal llamados científicos de datos).

Más sobre el artículo raro, raro, raro

No he podido evitar darle vueltas al artículo que comenté el otro día aquí, Bayesian Estimation with Informative Priors is Indistinguishable from Data Falsification, de la manera más caritativa posible. En particular, me he preguntado:

  • ¿Por qué se escribió (en lugar de no haberse escrito)?
  • ¿Por qué se escribió en esos términos (en lugar de en otros)?

Obviamente, el artículo no enseña nada desde el punto de vista técnico. Desde el metodológico, tampoco: recuerda más que a otra cosa, a esos físicos que muchos años después aún despotricaban contra la teoría de la relatividad.

El incentivo perverso

Viene a cuenta de este tuit,

que hace referencia a este parrafito en el artículo enlazado:

Quizás lo más grave es que el acceso a los datos está siendo restringido incluso entre científicos. “Desde el principio solicitamos información desagregada por municipio y franjas de edad al Instituto Carlos III —explica Manrubia—. Recibimos la respuesta de que se estaban revisando y que pronto se harían públicos. Todavía no lo son. La opacidad en los datos sonaba a ocultismo”. También Diego Ramiro, del Instituto de Economía, Geografía y Demografía del CSIC, describe una experiencia similar después de haber solicitado datos al ISCIII sin éxito: “No podrán dar respuesta por el poco personal que tienen”.

Un artículo muy raro, raro, raro

Hoy voy a comentar un artículo muy raro que me ha llegado recientemente y que se titula nada menos que Bayesian Estimation with Informative Priors is Indistinguishable from Data Falsification.

Argumenta el artículo alrededor de lo siguiente (que creo que ya sabemos todos: son ejercicios matemáticos básicos de un curso introductorio de probabilidad):

  • Que la inferencia bayesiana con prioris planas (degeneradas, de ser necesario) es equivalente a la inferencia frecuentista.
  • Que para tres ejemplos concretos (binomial, Poisson y normal), de usarse prioris a través de las distribuciones conjugadas, el resultado de la inferencia bayesiana es equivalente a haber añadido datos (problemas de redondeo aparte) a los originales.

Luego añade unos experimentos numéricos para dejar constancia de que no se ha equivocado en las cuentas y mostrar que, efectivamente, sustituyendo las letras por números y operando se obtienen los resultados que anuncian las matemáticas con su árido simbolismo.