Sobre los efectos heterogéneos, la menguante calidad de las estadísticas públicas y algunos asuntos estadísticos más
-
El término y concepto de varianza se acuñaron para, al parecer, poder definir el de heredabilidad en la protogenética decimonónica. Dos artículos muy interesantes y accesibles sobre el tema (sobre todo el segundo), son Missing Heritability: Much More Than You Wanted To Know de Scott Alexander y Heritability puzzlers de Dynomight. (Si crees, como yo, que el segundo tiene un gazapo o inconsistencia, deja una nota en los comentarios).
-
Solomon Kurz ha publicado material para aprender Stan con brms (partes I, II y III). Tengo dos objeciones al uso de
brms
: primero, que al usarlo no se aprende Stan sino otra cosa; y, segundo, que la interfaz de fórmula para la especificación de modelos, que es lo que permite brms, da de sí lo que da de sí y no más. Es cierto que casi siempre buscamos implementar modelos que admiten una interfaz de fórmula, pero esos son, precisamente, los más sencillos y para los que los LLMs tendrían menos problemas para generar el correspondiente código de Stan. -
Es bien sabido que, en los últimos tiempos, las calidad de las estadísticas públicas está menguando en muchos países. Pero eso afecta, en principio, a la varianza. Uno de los motivos por los que las estadísticas públicas, en principio, no tienen sesgos y, en particular, no tienen sesgos con intencionalidad política, es que tienen que defenderse constantemente de quienes afirman que sí. Solo Dios sabe qué pasaría si nos faltasen los troles, tengan estos pelo naranja o no.
-
Quienes sostienen que las estadísticas públicas siempre y en todo lugar están exentas de sesgos motivados políticamente, deberían echar un vistazo a la historia del cálculo de la inflación en Argentina o lo que pasó en Grecia antes de 2008.
-
No entiendo muy bien la entrada Stimulus Plots de DataColada porque no he invertido el tiempo necesario para averiguar cuáles son esos estímulos a los que se refiere. Entiendo que es algún tipo de tratamiento concreto y que el argumento principal es que decir que un tratamiento tiene un efecto promedio determinado no es lo mismo que decir que el efecto en cada caso está próximo a esa media y que no varía según otras características de los sujetos. En el fondo, está caminando en dirección opuesta a la de la estadística decimonónica —y la inercia que arrastra hasta la actualidad— de pensar en sujetos esféricos, en el homme moyen. En particular, dicen:
Lo más tentador cuando se comparan medias es no pensar en los estímulos subyacentes y aceptar que el estudio simplemente ha generado y comparado unas medias. La segunda cosa más tentadora es imaginar que todos los estímulos tienen esencialmente el mismo efecto. La tercera, imaginar que los distintos estímulos tienen efectos ligeramente distintos, pero todos simétricamente distribuidos alrededor del valor central […]. Pero no hay ningún motivo para que ocurra así. Cada estímulo es distinto y puede tener efectos reales diferentes. Así que sugerimos una cuarta opción: no dar por hecho nada de antemano y examinar los datos.